分页: 1 / 1

#1 (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 11:50
bigball
此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021

#2 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 11:51
bigball
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
护城河没了啊

小鸡毛给口暴力

#3 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 11:57
赖美豪中
我tmd都不知道该说什么好,现在cuda developer是不是脸Ptx code是啥都不知道?我们当年开始学这玩意的时候,这都是最基本的, 还什么变相绕过限制。现在二货真是bullshit张嘴就来,lol
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021

#4 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:05
jiml
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
五毛卵子,侬娘给侬找了个棒子野爹

#5 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:07
bigballz
jiml 写了: 2025年 1月 29日 12:05 五毛卵子,侬娘给侬找了个棒子野爹
lol

尼玛介绍的

#6 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:08
wass
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021
那是因为它买的阉割版gpu,阉割的就是通讯通道

#7 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:16
drifter
wass 写了: 2025年 1月 29日 12:08 那是因为它买的阉割版gpu,阉割的就是通讯通道
结果阉割了个包皮

#8 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:19
bigballz
drifter 写了: 2025年 1月 29日 12:16 结果阉割了个包皮
射的更快了

#9 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 12:23
bigballz
jiml 写了: 2025年 1月 29日 12:05 五毛卵子,侬娘给侬找了个棒子野爹
口交逼
今天阿哥再帮弄老婆 弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead

#10 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 13:01
jiml
bigballz 写了: 2025年 1月 29日 12:23 口交逼
今天阿哥再帮弄老婆 弄女儿介绍个叫tom 的客人

https://www.tomshardware.com/tech-indus ... ng-instead
五毛卵子,侬娘在下只角卖屁股呢,扯淡CUDE,装神马高大尚啊?

#11 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 13:21
bigballz
jiml 写了: 2025年 1月 29日 13:01 五毛卵子,侬娘在下只角卖屁股呢,扯淡CUDE,装神马高大尚啊?
lol cude 弄只蓝雾逼
今晚弄老娘和tom 韩国人双一二王一后

弄可以去帮忙

#12 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 13:47
maxthon
如果这是真的,美国商务部要检讨了,制定的规范被轻易绕过去。
bigball 写了: 2025年 1月 29日 11:50 此帖转自 limitedBB 在 军事天地(Military) 的帖子:完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

这一次是DeepSeek-V3论文中的更多细节,被人挖掘出来。

来自Mirae Asset Securities Research(韩国未来资产证券)的分析称,V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。

在使用英伟达的H800 GPU训练DeepSeek-V3时,他们针对自己的需求把132个流式多处理器(SMs)中的20个修改成负责服务器间的通信,而不是计算任务。

变相绕过了硬件对通信速度的限制。

图片

寿司1:https://www.tomshardware.com/tech-indus ... ng-instead
寿司2:https://www.6parknews.com/newspark/view ... nid=708021

#13 Re: (转载)完了,“DeepSeek甚至绕过CUDA”论文细节再引热议

发表于 : 2025年 1月 29日 13:57
bigballz
maxthon 写了: 2025年 1月 29日 13:47 如果这是真的,美国商务部要检讨了,制定的规范被轻易绕过去。
这也不能怪商务部

自由市场总能发现门道

而且。我弟这帮官僚老boomer 又能懂个几把呢