慢一倍不可能的,EPYC也不能跑ICC,需要AOCC,這也不算是GCC。說EPYC慢的,只能說明你們根本不會優化,看PMC報告了嗎?打Sampling了嗎?搞沒搞eBPF插入?瓶頸在哪裡知道嗎?試NPS4了嗎?CPU pinning了沒?不要上來就空口無憑說EPYC慢。。。我知道上百種CPU優化方法赖美豪中 写了: 2025年 8月 6日 10:20 大兄弟我看你就没正经写过任何程序。你这套玩意和hpc center那些admin吹法是一毛一样,实际工作里就没有任何程序能在epyc上泡好的,我们所有的code换epyc 3年多了,还是只能用Intel complier,用amd给我们推荐的gcc全部慢一倍以上
我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
版主: 牛河梁
#41 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
#42 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
笑尿了,你完全没写过一行计算code对么?你是不是只会写pytorch这种玩意。
magagop 写了: 2025年 8月 6日 10:31 慢一倍不可能的,EPYC也不能跑ICC,需要AOCC,這也不算是GCC。說EPYC慢的,只能說明你們根本不會優化,看PMC報告了嗎?打Sampling了嗎?搞沒搞eBPF插入?瓶頸在哪裡知道嗎?試NPS4了嗎?CPU pinning了沒?不要上來就空口無憑說EPYC慢。。。我知道上百種CPU優化方法
If printing money would end poverty, printing diplomas would end stupidity.
#43 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
AMD的CPU用Intel compiler反而跑的更快?你知道你在说什么吗,学过一天PL & compilers的都知道compiler是针对自家microarchitecture做优化的,如果自家compiler还不如别家compiler,AMD compiler团队可以就地解散了,资本不养不但不出活、还帮倒忙的闲人
Devil doesn't need an advocate
#45 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
yes, 这就是hpc界的共识,所有heavily numerical computation, intel complier任然是best, 没有办法。 AMD 不存在可以用的complier. dell和amd自己的consultant只建议用gcc
biggestballs 写了: 2025年 8月 6日 10:48 AMD的CPU用Intel compiler反而跑的更快?你知道你在说什么吗,学过一天PL & compilers的都知道compiler是针对自家microarchitecture做优化的,如果自家compiler还不如别家compiler,AMD compiler团队可以就地解散了,资本不养不但不出活、还帮倒忙的闲人
If printing money would end poverty, printing diplomas would end stupidity.
#46 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
我要看懂什么?你第一句就露馅了,epyc是x86体系为啥不能用intel complier?
If printing money would end poverty, printing diplomas would end stupidity.
#47 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
MSA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。
#48 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071赖美豪中 写了: 2025年 8月 6日 11:00 yes, 这就是hpc界的共识,所有heavily numerical computation, intel complier任然是best, 没有办法。 AMD 不存在可以用的complier. dell和amd自己的consultant只建议用gcc
没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截
Devil doesn't need an advocate
#49 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
我看到一个Intel compiler dev说的话,他说他们的目标就是做出最优的compiler,不管用户用的是哪家的CPU,想必他们针对AMD CPU的优化也做到极致了magagop 写了: 2025年 8月 6日 11:08 MSA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。
Devil doesn't need an advocate
#50 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
笑尿了,你要看什么指令集,epyc这垃圾还在忙着雪avx呢,你让我他看他什么指令集?mca又不是amd才有,关键看了能解决jb毛问题么?用icc为什么没人支持?我们花8,9位数买的系统服务为什么没人支持?
magagop 写了: 2025年 8月 6日 11:08 MCA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。
If printing money would end poverty, printing diplomas would end stupidity.
#51 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
没错,就和amd买的测评一样,aocc在能编译起来的情况下跑Hello world肯定是最棒的,问题是除了amd自己根本没人用
biggestballs 写了: 2025年 8月 6日 11:09 我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071
没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截
If printing money would end poverty, printing diplomas would end stupidity.
#52 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
你也别太狂了,人家用的workloads是a real-world scientific application dedicated to the numerical modeling of alloy solidification with the PF method and GFD scheme for solving governing PDEs
Hello 鸡毛 world
Devil doesn't need an advocate
#53 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。biggestballs 写了: 2025年 8月 6日 11:11 我看到一个Intel compiler dev说的话,他说他们的目标就是做出最优的compiler,不管用户用的是哪家的CPU,想必他们针对AMD CPU的优化也做到极致了
#54 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
biggestballs 写了: 2025年 8月 6日 11:09 我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071
没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截
If printing money would end poverty, printing diplomas would end stupidity.
#55 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
你用ICC在EPYC上跑得慢,你找AMD支持?ICC是開源軟件嗎?你搞笑嗎?買EPYC就老老實實用AOCC,無法擺脫ICC就買高價低能的Xeon,period。赖美豪中 写了: 2025年 8月 6日 11:12 笑尿了,你要看什么指令集,epyc这垃圾还在忙着雪avx呢,你让我他看他什么指令集?mca又不是amd才有,关键看了能解决jb毛问题么?用icc为什么没人支持?我们花8,9位数买的系统服务为什么没人支持?
#56 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
什么real world, 那玩意都是指定优化过的,就是我们说的hello world. 实际应用有很多坑。他这个gfd就是一个有限差分,边界条件特定的话,没啥坑,就是个hello world
biggestballs 写了: 2025年 8月 6日 11:16 你也别太狂了,人家用的workloads是a real-world scientific application dedicated to the numerical modeling of alloy solidification with the PF method and GFD scheme for solving governing PDEs
Hello 鸡毛 world
If printing money would end poverty, printing diplomas would end stupidity.
#57 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
ICC有个-xHOST option:https://community.intel.com/t5/Intel-Fo ... -p/1392091magagop 写了: 2025年 8月 6日 11:19 不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。
只能说明AMD compiler额外的那些优化都对性能帮助不大
Devil doesn't need an advocate
#58 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
大兄弟你是amd员工么?能不能反应一下,多针对实际应用来测试,不能只关心ppt. 当然如果你在epyc上跑docker+pytorch我觉得区别真不大
magagop 写了: 2025年 8月 6日 11:19 不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。
If printing money would end poverty, printing diplomas would end stupidity.
#59 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
這就是我一直強調的:你的記憶和經驗都在20年前,你沒有最近的EPYC經驗。你說的這些問題現在都不存在,例子就是El Capitan MI300A,Intel的Aurora基本放棄治療了。赖美豪中 写了: 2025年 8月 6日 11:21 gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
x1

#60 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
基本的trade-off常识,通用就不会最高效,高效就不能通用,为了通用就要牺牲效率/性能赖美豪中 写了: 2025年 8月 6日 11:21 gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
Devil doesn't need an advocate