magagop 写了: 2025年 8月 6日 11:27 這就是我一直強調的:你的記憶和經驗都在20年前,你沒有最近的EPYC經驗。你說的這些問題現在都不存在,例子就是El Capitan MI300A,Intel的Aurora基本放棄治療了。
我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
版主: 牛河梁
#61 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
大哥我现在用的就是epyc,你要干嘛?我不是说epyc很烂,但是根本没有比xeon强,我们用epyc+icc也能achieve和上一代xeon差不多的性能。反正我现在也就是混日子,不会较真这些玩意,更不可能去花时间优化这破烂,以我的经验,过几年就全换了
If printing money would end poverty, printing diplomas would end stupidity.
#62 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
「Note though there seems to be a bug in Intel Classic compilers >= 19.1 where it falls back to x87 instructions (not even SSE2, I think it's the equivalent of -march=pentium, the original one from 1993) on AMD for -xHOST (for both C(++) and Fortran). -march=core-avx2 works fine, and the oneAPI compilers work fine too.」biggestballs 写了: 2025年 8月 6日 11:25 ICC有个-xHOST option:https://community.intel.com/t5/Intel-Fo ... -p/1392091
只能说明AMD compiler额外的那些优化都对性能帮助不大
第一:有bug沒人管,ICC在EPYC上的bug兩家都不管。你如果牛你自己workaround。
第二:AVX2太老了,十年前的東西,現在Zen4/Zen5全面支持AVX512,指定用AVX2當然慢多了。
第三:ICC沒辦法在EPYC是配合Vtunes,沒有Vtunes,所有優化都是盲人摸象
#63 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
我推薦你直接對比關鍵函數的匯編實現,根據你說的情況,ICC針對EPYC肯定產生了完全不同的匯編代碼。如果ICC針對Xeon產生的機器碼不能直接在EPYC上運行,這就是我說的Intel偷偷用了手冊裡面沒有的指令來優化,這也是ICC不能開源的原因之一。赖美豪中 写了: 2025年 8月 6日 11:31 大哥我现在用的就是epyc,你要干嘛?我不是说epyc很烂,但是根本没有比xeon强,我们用epyc+icc也能achieve和上一代xeon差不多的性能。反正我现在也就是混日子,不会较真这些玩意,更不可能去花时间优化这破烂,以我的经验,过几年就全换了
#64 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
大兄弟你在逗我么?这些玩意都是从server vendor lease回来的,3,5年一个合同,下一批可能就换xeon,我浪费我的时间干嘛?我调完了一点credit也不会有,全被Hpc那些人拿走了
magagop 写了: 2025年 8月 6日 11:41 我推薦你直接對比關鍵函數的匯編實現,根據你說的情況,ICC針對EPYC肯定產生了完全不同的匯編代碼。如果ICC針對Xeon產生的機器碼不能直接在EPYC上運行,這就是我說的Intel偷偷用了手冊裡面沒有的指令來優化,這也是ICC不能開源的原因之一。
If printing money would end poverty, printing diplomas would end stupidity.
#65 Re: 我就說AMD值$160吧,低於$120就可以無腦進,高於$200可以無腦賣,因為跟GPU無關
那就不要說你對EPYC做過調優,你就是改了ICC的arch成EPYC而已,根本沒看底層。赖美豪中 写了: 2025年 8月 6日 11:52 大兄弟你在逗我么?这些玩意都是从server vendor lease回来的,3,5年一个合同,下一批可能就换xeon,我浪费我的时间干嘛?我调完了一点credit也不会有,全被Hpc那些人拿走了