分页: 2 / 9

#21 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:21
xexz
verdelite 写了: 2025年 2月 25日 23:11 大概是:不需要买几万刀一片的芯片了,只需要买几千一片的,用新算法也很快。
上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。

#22 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:22
takeway
一剑定清风 写了: 2025年 2月 25日 23:11 这个牛逼了,我也不太懂,为啥这个也开源
刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业

#23 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:25
wanmeishijie
takeway 写了: 2025年 2月 25日 23:22 刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业
其实美帝医药这么发达,炒作长生药更合理

#24 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:28
xexz
xexz 写了: 2025年 2月 25日 23:21 上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
这个JIT算deepseek的核心科技。

开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,

众生平等了。 :mrgreen: :mrgreen: :mrgreen:

#25 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:30
verdelite
xexz 写了: 2025年 2月 25日 23:21 上面是个JIT虚拟机,下层用的nvGPU的汇编🐎

意思是,其他家的GPU只要实现NV的汇编🐎(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?

#26 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:36
realbug
Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。

#27 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:39
xexz
verdelite 写了: 2025年 2月 25日 23:30 我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?
他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:

#28 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:41
xexz
realbug 写了: 2025年 2月 25日 23:36 Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。
姜文告诉周润发:“没有你很重要。”

#29 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:41
buce
这几天AI股跌的那个惨

#30 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:42
Miraboreasu
不懂就问 这不还是cuda.h么

#31 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:42
happens
xexz 写了: 2025年 2月 25日 23:28 这个JIT算deepseek的核心科技。

开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,

众生平等了。 :mrgreen: :mrgreen: :mrgreen:
苏妈今晚笑醒了

#32 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:43
verdelite
xexz 写了: 2025年 2月 25日 23:39 他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:
那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。

#33 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:44
用户168
以后出现专门的AI芯片,才算完

#34 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:45
midlander
xexz 写了: 2025年 2月 25日 23:39 他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。

这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。 :mrgreen: :mrgreen: :mrgreen:
amd不是做了适配了么?都不敢开源

#35 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:47
Havana
不急,等老将们找出里面的bug才好做结论。
xexz 写了: 2025年 2月 25日 22:42 你们快去看看吧,完了,完了,完了。。。。。。nv这回是真完了。 :mrgreen: :mrgreen: :mrgreen:

#36 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:48
verdelite
用户168 写了: 2025年 2月 25日 23:44 以后出现专门的AI芯片,才算完
NVDA钱多人多经验丰富,它要抢先推出这样的芯片。

#37 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:49
realbug
据说ds已经可以在华为的晟腾910B上推理了,这个想做应该不难
verdelite 写了: 2025年 2月 25日 23:43 那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。

#38 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:54
用户168
verdelite 写了: 2025年 2月 25日 23:48 NVDA钱多人多经验丰富,它要抢先推出这样的芯片。
非常难。如果历史可以借鉴的话,就知道这事情得新公司去干。远的比如柯达发明了电子相机,但是舍不得胶卷生意,结果就失去了电子相机市场。近的INTC失去移动芯片的市场,微软老是想把windows搬得手机上也行不通。

#39 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:55
rtyu
为什么今天发?明天NVDA发财报。这是有目的的!

#40 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。

发表于 : 2025年 2月 25日 23:57
verdelite
rtyu 写了: 2025年 2月 25日 23:55 为什么今天发?明天NVDA发财报。这是有目的的!
梁文锋是搞金融的。。。