分页: 2 / 9
#21 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:21
由 xexz
verdelite 写了: 2025年 2月 25日 23:11
大概是:不需要买几万刀一片的芯片了,只需要买几千一片的,用新算法也很快。
上面是个JIT虚拟机,下层用的nvGPU的汇编

,
意思是,其他家的GPU只要实现NV的汇编

(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
#22 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:22
由 takeway
一剑定清风 写了: 2025年 2月 25日 23:11
这个牛逼了,我也不太懂,为啥这个也开源
刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业
#23 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:25
由 wanmeishijie
takeway 写了: 2025年 2月 25日 23:22
刺破自己的房产泡沫后,开始来刺美帝的AI泡沫?美帝听了谁的忽悠押宝AI和芯片,不能吃不能烧,还不能提供广大就业
其实美帝医药这么发达,炒作长生药更合理
#24 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:28
由 xexz
xexz 写了: 2025年 2月 25日 23:21
上面是个JIT虚拟机,下层用的nvGPU的汇编

,
意思是,其他家的GPU只要实现NV的汇编

(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
这个JIT算deepseek的核心科技。
开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,
众生平等了。

#25 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:30
由 verdelite
xexz 写了: 2025年 2月 25日 23:21
上面是个JIT虚拟机,下层用的nvGPU的汇编

,
意思是,其他家的GPU只要实现NV的汇编

(这个对那些GPU硬件厂家跟没要求一样),用谁的GPU都一样一样的。
我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?
#26 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:36
由 realbug
Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。
#27 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:39
由 xexz
verdelite 写了: 2025年 2月 25日 23:30
我看他还是用了CUDA,别的厂家可以用吗?还是这个更容易绕过?
他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。
这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。

#28 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:41
由 xexz
realbug 写了: 2025年 2月 25日 23:36
Ds这波操作基本上是在说,我活不活无所谓,但你一定要死。
姜文告诉周润发:“没有你很重要。”
#29 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:41
由 buce
这几天AI股跌的那个惨
#30 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:42
由 Miraboreasu
不懂就问 这不还是cuda.h么
#31 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:42
由 happens
xexz 写了: 2025年 2月 25日 23:28
这个JIT算deepseek的核心科技。
开源之后,会有很多GPU、NPU、LPU各种pu厂家,忙不迭的贡献这些代码,
众生平等了。
苏妈今晚笑醒了
#32 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:43
由 verdelite
xexz 写了: 2025年 2月 25日 23:39
他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。
这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。
那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。
#33 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:44
由 用户168
以后出现专门的AI芯片,才算完
#34 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:45
由 midlander
xexz 写了: 2025年 2月 25日 23:39
他是一个JIT虚拟机,目前,底层是基于nvGPU汇编代码,这部分也公开了,其他厂家只要实现这些汇编就可以用这个JIT虚拟机。
这个对其他硬件厂家没难度,GPU不是cpu,指令集简单得多。甚至多核的有单指令多数据指令的CPU也能表现的很强劲(当然,cpu核心少,不是一个数量级)。
amd不是做了适配了么?都不敢开源
#35 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:47
由 Havana
#36 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:48
由 verdelite
用户168 写了: 2025年 2月 25日 23:44
以后出现专门的AI芯片,才算完
NVDA钱多人多经验丰富,它要抢先推出这样的芯片。
#37 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:49
由 realbug
据说ds已经可以在华为的晟腾910B上推理了,这个想做应该不难
verdelite 写了: 2025年 2月 25日 23:43
那我们等等看啥时候能出第一个用这些代码(或者其变种,毕竟改400行代码应该比较容易)的非NVDA芯片。
#38 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:54
由 用户168
verdelite 写了: 2025年 2月 25日 23:48
NVDA钱多人多经验丰富,它要抢先推出这样的芯片。
非常难。如果历史可以借鉴的话,就知道这事情得新公司去干。远的比如柯达发明了电子相机,但是舍不得胶卷生意,结果就失去了电子相机市场。近的INTC失去移动芯片的市场,微软老是想把windows搬得手机上也行不通。
#39 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:55
由 rtyu
为什么今天发?明天NVDA发财报。这是有目的的!
#40 Re: 完了,deepseek把GPU上的fp8的汇编代码开源了。
发表于 : 2025年 2月 25日 23:57
由 verdelite
rtyu 写了: 2025年 2月 25日 23:55
为什么今天发?明天NVDA发财报。这是有目的的!
梁文锋是搞金融的。。。