(转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

股市相关讨论

版主: 牛河梁alexwlt1024

回复
bigball楼主
论坛支柱
论坛支柱
帖子互动: 374
帖子: 9062
注册时间: 2022年 7月 30日 02:23

#1 (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigball楼主 »

此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
图片
bigball楼主
论坛支柱
论坛支柱
帖子互动: 374
帖子: 9062
注册时间: 2022年 7月 30日 02:23

#2 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigball楼主 »

bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
护城河没了啊

小鸡毛给口暴力
图片
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3550
帖子: 41583
注册时间: 2022年 9月 6日 12:50

#3 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 赖美豪中(my pronouns: ha/ha) »

我tmd都不知道该说什么好,现在cuda developer是不是脸Ptx code是啥都不知道?我们当年开始学这玩意的时候,这都是最基本的, 还什么变相绕过限制。现在二货真是bullshit张嘴就来,lol
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021

+2.00 积分 [版主 牛河梁 发放的奖励]
x2 图片
If printing money would end poverty, printing diplomas would end stupidity.
头像
jiml
著名点评
著名点评
帖子互动: 364
帖子: 3359
注册时间: 2023年 2月 22日 22:50

#4 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 jiml »

bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
五毛卵子,侬娘给侬找了个棒子野爹
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#5 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigballz »

jiml 写了: 2025年 1月 29日 12:05 五毛卵子,侬娘给侬找了个棒子野爹
lol

尼玛介绍的
wass
论坛精英
论坛精英
2024年度优秀版主
wass 的博客
帖子互动: 646
帖子: 6632
注册时间: 2022年 7月 23日 22:13

#6 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 wass »

bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
那是因为它买的阉割版gpu,阉割的就是通讯通道
drifter
论坛精英
论坛精英
帖子互动: 398
帖子: 6889
注册时间: 2022年 9月 1日 04:17

#7 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 drifter »

wass 写了: 2025年 1月 29日 12:08 那是因为它买的阉割版gpu,阉割的就是通讯通道
结果阉割了个包皮
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#8 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigballz »

drifter 写了: 2025年 1月 29日 12:16 结果阉割了个包皮
射的更快了
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#9 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigballz »

jiml 写了: 2025年 1月 29日 12:05 五毛卵子,侬娘给侬找了个棒子野爹
口交逼
今天阿哥再帮弄老婆 弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead
头像
jiml
著名点评
著名点评
帖子互动: 364
帖子: 3359
注册时间: 2023年 2月 22日 22:50

#10 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 jiml »

bigballz 写了: 2025年 1月 29日 12:23 口交逼
今天阿哥再帮弄老婆 弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead
五毛卵子,侬娘在下只角卖屁股呢,扯淡CUDE,装神马高大尚啊?
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#11 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigballz »

jiml 写了: 2025年 1月 29日 13:01 五毛卵子,侬娘在下只角卖屁股呢,扯淡CUDE,装神马高大尚啊?
lol cude 弄只蓝雾逼
今晚弄老娘和tom 韩国人双一二王一后

弄可以去帮忙
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#12 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 maxthon »

如果这是真的,美国商务部要检讨了,制定的规范被轻易绕过去。
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
bigballz
知名作家
知名作家
帖子互动: 51
帖子: 791
注册时间: 2024年 6月 7日 18:19

#13 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

帖子 bigballz »

maxthon 写了: 2025年 1月 29日 13:47 如果这是真的,美国商务部要检讨了,制定的规范被轻易绕过去。
这也不能怪商务部

自由市场总能发现门道

而且。我弟这帮官僚老boomer 又能懂个几把呢
回复

回到 “股海弄潮(Stock)”