（转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

bigball · 帖子由 **bigball楼主** » 2025年 1月 29日 11:50

此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

bigball · 帖子由 **bigball楼主** » 2025年 1月 29日 11:51

bigball 写了： 2025年 1月 29日 11:50 此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

护城河没了啊

小鸡毛给口暴力

赖美豪中

我tmd都不知道该说什么好，现在cuda developer是不是脸Ptx code是啥都不知道？我们当年开始学这玩意的时候，这都是最基本的, 还什么变相绕过限制。现在二货真是bullshit张嘴就来，lol

bigball 写了： 2025年 1月 29日 11:50 此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

jiml · 帖子由 **jiml** » 2025年 1月 29日 12:05

bigball 写了： 2025年 1月 29日 11:50 此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

五毛卵子，侬娘给侬找了个棒子野爹

bigballz · 帖子由 **bigballz** » 2025年 1月 29日 12:07

jiml 写了： 2025年 1月 29日 12:05 五毛卵子，侬娘给侬找了个棒子野爹

lol

尼玛介绍的

wass · 帖子由 **wass** » 2025年 1月 29日 12:08

bigball 写了： 2025年 1月 29日 11:50 此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

那是因为它买的阉割版gpu，阉割的就是通讯通道

drifter · 帖子由 **drifter** » 2025年 1月 29日 12:16

wass 写了： 2025年 1月 29日 12:08 那是因为它买的阉割版gpu，阉割的就是通讯通道

结果阉割了个包皮

bigballz · 帖子由 **bigballz** » 2025年 1月 29日 12:19

drifter 写了： 2025年 1月 29日 12:16 结果阉割了个包皮

射的更快了

bigballz · 帖子由 **bigballz** » 2025年 1月 29日 12:23

jiml 写了： 2025年 1月 29日 12:05 五毛卵子，侬娘给侬找了个棒子野爹

口交逼
今天阿哥再帮弄老婆弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead

jiml · 帖子由 **jiml** » 2025年 1月 29日 13:01

bigballz 写了： 2025年 1月 29日 12:23 口交逼
今天阿哥再帮弄老婆弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead

五毛卵子，侬娘在下只角卖屁股呢，扯淡CUDE，装神马高大尚啊？

bigballz · 帖子由 **bigballz** » 2025年 1月 29日 13:21

jiml 写了： 2025年 1月 29日 13:01 五毛卵子，侬娘在下只角卖屁股呢，扯淡CUDE，装神马高大尚啊？

lol cude 弄只蓝雾逼
今晚弄老娘和tom 韩国人双一二王一后

弄可以去帮忙

maxthon · 帖子由 **maxthon** » 2025年 1月 29日 13:47

如果这是真的，美国商务部要检讨了，制定的规范被轻易绕过去。

bigball 写了： 2025年 1月 29日 11:50 此帖转自 limitedBB 在军事天地（Military）的帖子：完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节，被人挖掘出来。

来自Mirae Asset Securities Research（韩国未来资产证券）的分析称，V3的硬件效率之所以能比Meta等高出10倍，可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时，他们针对自己的需求把132个流式多处理器（SMs）中的20个修改成负责服务器间的通信，而不是计算任务。

变相绕过了硬件对通信速度的限制。

寿司1：https://www.tomshardware.com/tech-indus ... ng-instead
寿司2：https://www.6parknews.com/newspark/view ... nid=708021

bigballz · 帖子由 **bigballz** » 2025年 1月 29日 13:57

maxthon 写了： 2025年 1月 29日 13:47 如果这是真的，美国商务部要检讨了，制定的规范被轻易绕过去。

这也不能怪商务部

自由市场总能发现门道

而且。我弟这帮官僚老boomer 又能懂个几把呢

新未名空间

（转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#1 （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#2 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#3 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#4 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#5 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#6 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#7 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#8 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#9 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#10 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#11 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#12 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议

#13 Re: （转载）完了，“DeepSeek甚至绕过CUDA”论文细节再引热议