分页: 3 / 4

#41 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 10:31
magagop
赖美豪中 写了: 2025年 8月 6日 10:20 大兄弟我看你就没正经写过任何程序。你这套玩意和hpc center那些admin吹法是一毛一样,实际工作里就没有任何程序能在epyc上泡好的,我们所有的code换epyc 3年多了,还是只能用Intel complier,用amd给我们推荐的gcc全部慢一倍以上
慢一倍不可能的,EPYC也不能跑ICC,需要AOCC,這也不算是GCC。說EPYC慢的,只能說明你們根本不會優化,看PMC報告了嗎?打Sampling了嗎?搞沒搞eBPF插入?瓶頸在哪裡知道嗎?試NPS4了嗎?CPU pinning了沒?不要上來就空口無憑說EPYC慢。。。我知道上百種CPU優化方法

#42 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 10:40
赖美豪中
笑尿了,你完全没写过一行计算code对么?你是不是只会写pytorch这种玩意。
magagop 写了: 2025年 8月 6日 10:31 慢一倍不可能的,EPYC也不能跑ICC,需要AOCC,這也不算是GCC。說EPYC慢的,只能說明你們根本不會優化,看PMC報告了嗎?打Sampling了嗎?搞沒搞eBPF插入?瓶頸在哪裡知道嗎?試NPS4了嗎?CPU pinning了沒?不要上來就空口無憑說EPYC慢。。。我知道上百種CPU優化方法

#43 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 10:48
biggestballs
赖美豪中 写了: 2025年 8月 6日 10:20 我们所有的code换epyc 3年多了,还是只能用Intel complier
AMD的CPU用Intel compiler反而跑的更快?你知道你在说什么吗,学过一天PL & compilers的都知道compiler是针对自家microarchitecture做优化的,如果自家compiler还不如别家compiler,AMD compiler团队可以就地解散了,资本不养不但不出活、还帮倒忙的闲人

#44 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 10:49
magagop
赖美豪中 写了: 2025年 8月 6日 10:40 笑尿了,你完全没写过一行计算code对么?你是不是只会写pytorch这种玩意。
你先看懂我寫的東西再說

#45 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:00
赖美豪中
yes, 这就是hpc界的共识,所有heavily numerical computation, intel complier任然是best, 没有办法。 AMD 不存在可以用的complier. dell和amd自己的consultant只建议用gcc
biggestballs 写了: 2025年 8月 6日 10:48 AMD的CPU用Intel compiler反而跑的更快?你知道你在说什么吗,学过一天PL & compilers的都知道compiler是针对自家microarchitecture做优化的,如果自家compiler还不如别家compiler,AMD compiler团队可以就地解散了,资本不养不但不出活、还帮倒忙的闲人

#46 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:03
赖美豪中
我要看懂什么?你第一句就露馅了,epyc是x86体系为啥不能用intel complier?
magagop 写了: 2025年 8月 6日 10:49 你先看懂我寫的東西再說

#47 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:08
magagop
赖美豪中 写了: 2025年 8月 6日 11:03 我要看懂什么?你第一句就露馅了,epyc是x86体系为啥不能用intel complier?
MSA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。

#48 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:09
biggestballs
赖美豪中 写了: 2025年 8月 6日 11:00 yes, 这就是hpc界的共识,所有heavily numerical computation, intel complier任然是best, 没有办法。 AMD 不存在可以用的complier. dell和amd自己的consultant只建议用gcc
我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071

没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截

#49 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:11
biggestballs
magagop 写了: 2025年 8月 6日 11:08 MSA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。
我看到一个Intel compiler dev说的话,他说他们的目标就是做出最优的compiler,不管用户用的是哪家的CPU,想必他们针对AMD CPU的优化也做到极致了

#50 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:12
赖美豪中
笑尿了,你要看什么指令集,epyc这垃圾还在忙着雪avx呢,你让我他看他什么指令集?mca又不是amd才有,关键看了能解决jb毛问题么?用icc为什么没人支持?我们花8,9位数买的系统服务为什么没人支持?
magagop 写了: 2025年 8月 6日 11:08 MCA是啥知道嗎?你優化時是不是根本不看匯編指令?ICC用的很多東西AMD EPYC根本就沒有。你在EPYC上用ICC就是外行,出問題了沒人給你提供技術支持。。。

#51 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:14
赖美豪中
没错,就和amd买的测评一样,aocc在能编译起来的情况下跑Hello world肯定是最棒的,问题是除了amd自己根本没人用
biggestballs 写了: 2025年 8月 6日 11:09 我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071

没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截

#52 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:16
biggestballs
赖美豪中 写了: 2025年 8月 6日 11:14 没错,就和amd买的测评一样,aocc在能编译起来的情况下跑Hello world肯定是最棒的,问题是除了amd自己根本没人用
你也别太狂了,人家用的workloads是a real-world scientific application dedicated to the numerical modeling of alloy solidification with the PF method and GFD scheme for solving governing PDEs

Hello 鸡毛 world

#53 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:19
magagop
biggestballs 写了: 2025年 8月 6日 11:11 我看到一个Intel compiler dev说的话,他说他们的目标就是做出最优的compiler,不管用户用的是哪家的CPU,想必他们针对AMD CPU的优化也做到极致了
不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。

#54 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:21
赖美豪中
gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
biggestballs 写了: 2025年 8月 6日 11:09 我查了一下,还是不能只听你一家之言的:https://www.sciencedirect.com/science/a ... 7821001071

没错,ICC是最优的,但GCC绝不是可以用的,AOCC比它好一大截

#55 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:22
magagop
赖美豪中 写了: 2025年 8月 6日 11:12 笑尿了,你要看什么指令集,epyc这垃圾还在忙着雪avx呢,你让我他看他什么指令集?mca又不是amd才有,关键看了能解决jb毛问题么?用icc为什么没人支持?我们花8,9位数买的系统服务为什么没人支持?
你用ICC在EPYC上跑得慢,你找AMD支持?ICC是開源軟件嗎?你搞笑嗎?買EPYC就老老實實用AOCC,無法擺脫ICC就買高價低能的Xeon,period。

#56 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:24
赖美豪中
什么real world, 那玩意都是指定优化过的,就是我们说的hello world. 实际应用有很多坑。他这个gfd就是一个有限差分,边界条件特定的话,没啥坑,就是个hello world
biggestballs 写了: 2025年 8月 6日 11:16 你也别太狂了,人家用的workloads是a real-world scientific application dedicated to the numerical modeling of alloy solidification with the PF method and GFD scheme for solving governing PDEs

Hello 鸡毛 world

#57 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:25
biggestballs
magagop 写了: 2025年 8月 6日 11:19 不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。
ICC有个-xHOST option:https://community.intel.com/t5/Intel-Fo ... -p/1392091

只能说明AMD compiler额外的那些优化都对性能帮助不大

#58 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:27
赖美豪中
大兄弟你是amd员工么?能不能反应一下,多针对实际应用来测试,不能只关心ppt. 当然如果你在epyc上跑docker+pytorch我觉得区别真不大
magagop 写了: 2025年 8月 6日 11:19 不可能的,AMD EPYC內部有上千個PMC用來調優,只有內部有資料,Intel的ICC怎麼可能把AMD的EPYC做到極致?這不是Arm,可以花錢買資料。

#59 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:27
magagop
赖美豪中 写了: 2025年 8月 6日 11:21 gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
這就是我一直強調的:你的記憶和經驗都在20年前,你沒有最近的EPYC經驗。你說的這些問題現在都不存在,例子就是El Capitan MI300A,Intel的Aurora基本放棄治療了。

#60 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關

发表于 : 2025年 8月 6日 11:29
biggestballs
赖美豪中 写了: 2025年 8月 6日 11:21 gcc肯定是最全面的,你们肯定都不是作数值计算的,计算方向gcc最通用,我们当年在学校都用gcc, icc也有但是intel对学校不给啥技术支持。在公司的话,你付钱买服务intel complier的服务一下就上去了。AOCC这玩意大家都不碰。 AMD的坑我从20年前就开始踩了,那时候是opteron, top 500那时候有不少operton的破烂了,也是标称好的不行,用了几下就放弃了,莫名其妙的死循环,memory swap, ccnuma啥的都是胡扯,只存在ppt上
基本的trade-off常识,通用就不会最高效,高效就不能通用,为了通用就要牺牲效率/性能