deepseek 把GPU需求倒退会A100时代

股市相关讨论

版主: 牛河梁alexwlt1024

回复
头像
jiml楼主
著名点评
著名点评
帖子互动: 364
帖子: 3359
注册时间: 2023年 2月 22日 22:50

#1 deepseek 把GPU需求倒退会A100时代

帖子 jiml楼主 »

deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂

+2.00 积分 [版主 牛河梁 发放的奖励]
x1 图片

标签/Tags:
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3548
帖子: 41555
注册时间: 2022年 9月 6日 12:50

#2 Re: deepseek 把GPU需求倒退会A100时代

帖子 赖美豪中(my pronouns: ha/ha) »

如果主要靠蒸馏,gpu需求几乎为0,大部分interference都是用CPU或者asic
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂
x1 图片
If printing money would end poverty, printing diplomas would end stupidity.
robot2022(R)
论坛精英
论坛精英
帖子互动: 309
帖子: 6930
注册时间: 2022年 12月 19日 13:28

#3 Re: deepseek 把GPU需求倒退会A100时代

帖子 robot2022(R) »

啥逻辑啊
以前n个小公司有需求,现在10n个有
话说Ds到底用了多少?不是他们有从新加坡买的吗
biggestballs
著名点评
著名点评
帖子互动: 369
帖子: 3583
注册时间: 2024年 2月 5日 19:42

#4 Re: deepseek 把GPU需求倒退会A100时代

帖子 biggestballs »

robot2022 写了: 2025年 2月 1日 08:24 啥逻辑啊
以前n个小公司有需求,现在10n个有
话说Ds到底用了多少?不是他们有从新加坡买的吗
就算需求增加,也不需要那么高端的芯片了,利润空间缩小

就好比伦敦飞纽约,协和式3小时到,普通飞机8小时,但协和式机票是普通飞机的3倍价格,你说一般人会怎么选?GPU很烧钱的,能省则省
x1 图片
Devil doesn't need an advocate
robot2022(R)
论坛精英
论坛精英
帖子互动: 309
帖子: 6930
注册时间: 2022年 12月 19日 13:28

#5 Re: deepseek 把GPU需求倒退会A100时代

帖子 robot2022(R) »

biggestballs 写了: 2025年 2月 1日 08:31 就算需求增加,也不需要那么高端的芯片了,利润空间缩小

就好比伦敦飞纽约,协和式3小时到,普通飞机8小时,但协和式机票是普通飞机的3倍价格,你说一般人会怎么选?GPU很烧钱的,能省则省
以前只能伦敦飞纽约
现在伦敦飞中国?
biggestballs
著名点评
著名点评
帖子互动: 369
帖子: 3583
注册时间: 2024年 2月 5日 19:42

#6 Re: deepseek 把GPU需求倒退会A100时代

帖子 biggestballs »

robot2022 写了: 2025年 2月 1日 08:32 以前只能伦敦飞纽约
现在伦敦飞中国?
说是要重返市场,不知道猴年马月
x1 图片
Devil doesn't need an advocate
Dididada(香烟瓜子八宝粥)
著名点评
著名点评
帖子互动: 389
帖子: 3807
注册时间: 2023年 11月 24日 08:33

#7 Re: deepseek 把GPU需求倒退会A100时代

帖子 Dididada(香烟瓜子八宝粥) »

robot2022 写了: 2025年 2月 1日 08:24 啥逻辑啊
以前n个小公司有需求,现在10n个有
话说Ds到底用了多少?不是他们有从新加坡买的吗
问题是这个DS有没有说实话?比如它到底用了多少GPU?它开发出来的成本只有不到6million 美刀?

据说它在2021年前就至少拥有10000块女大显卡了。
x1 图片
biggestballs
著名点评
著名点评
帖子互动: 369
帖子: 3583
注册时间: 2024年 2月 5日 19:42

#8 Re: deepseek 把GPU需求倒退会A100时代

帖子 biggestballs »

Dididada 写了: 2025年 2月 1日 08:47 问题是这个DS有没有说实话?比如它到底用了多少GPU?它开发出来的成本只有不到6million 美刀?

据说它在2021年前就至少拥有10000块女大显卡了。
给你们这些非科班的简单解释就是:是训练时的强化学习和蒸馏模型省的成本,且业界普遍接受了这一事实

用了多少GPU已经不重要了,你用它的算法你也能省,这个已经没有争议了

另外知识蒸馏不是DeepSeek原创的,2014年就被提出了,DeepSeek只是把它用到了最受益的场景下
x1 图片 x1 图片
上次由 biggestballs 在 2025年 2月 1日 08:56 修改。
Devil doesn't need an advocate
头像
mmking(上水)
论坛精英
论坛精英
帖子互动: 1152
帖子: 8287
注册时间: 2023年 1月 25日 05:10

#9 Re: deepseek 把GPU需求倒退会A100时代

帖子 mmking(上水) »

那倒不一定

以前gpu紧张,就像1980年用电脑一样,后来电脑普及了,大家会做更多的事儿

不过女大的好日子要开始变少了
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂
x1 图片
凡所有相,皆是虚妄
Dididada(香烟瓜子八宝粥)
著名点评
著名点评
帖子互动: 389
帖子: 3807
注册时间: 2023年 11月 24日 08:33

#10 Re: deepseek 把GPU需求倒退会A100时代

帖子 Dididada(香烟瓜子八宝粥) »

biggestballs 写了: 2025年 2月 1日 08:53 给你们这些非科班的简单解释就是:是训练时的强化学习和蒸馏模型省的成本,且业界普遍接受了这一事实

用了多少GPU已经不重要了,你用它的算法你也能省,这个已经没有争议了
那为什么其他做AI的企业没有走DS这条路?不懂就问,谢谢解惑。
biggestballs
著名点评
著名点评
帖子互动: 369
帖子: 3583
注册时间: 2024年 2月 5日 19:42

#11 Re: deepseek 把GPU需求倒退会A100时代

帖子 biggestballs »

Dididada 写了: 2025年 2月 1日 08:56 那为什么其他做AI的企业没有走DS这条路?不懂就问,谢谢解惑。
现在不是可以走了吗,总要有第一个吃螃蟹的,只是碰巧这次是天朝

引述网络的直接回答:“DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。”
x1 图片 x1 图片
Devil doesn't need an advocate
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3548
帖子: 41555
注册时间: 2022年 9月 6日 12:50

#12 Re: deepseek 把GPU需求倒退会A100时代

帖子 赖美豪中(my pronouns: ha/ha) »

当然都用啊,但是人家都是用自己的模型蒸馏,比如网页版o1-mini就是gpt4的蒸馏,只有区区8b参数,性能远低于4o,但是deepshit通过逆向工程去把市面上所有的开源蒸馏完了还蒸馏gpt,这是一个他娘的创举,lol
Dididada 写了: 2025年 2月 1日 08:56 那为什么其他做AI的企业没有走DS这条路?不懂就问,谢谢解惑。
x1 图片
If printing money would end poverty, printing diplomas would end stupidity.
Dididada(香烟瓜子八宝粥)
著名点评
著名点评
帖子互动: 389
帖子: 3807
注册时间: 2023年 11月 24日 08:33

#13 Re: deepseek 把GPU需求倒退会A100时代

帖子 Dididada(香烟瓜子八宝粥) »

biggestballs 写了: 2025年 2月 1日 09:07 现在不是可以走了吗,总要有第一个吃螃蟹的,只是碰巧这次是天朝

引述网络的直接回答:“DeepSeek的一项创新是开辟了从一个更大、更强大的模型中获取相对较少的数据样本(不到一百万个)来显著提高较小模型能力的思路。这一新思路可能引来大量初创公司的效仿。”
我看有新闻说openai允许做研究的人这么做,但是不能用这种方法来开发竞争产品。那这是不是实际情况?如果是这样,那岂不是说DS很无耻?
x1 图片 x1 图片
Dididada(香烟瓜子八宝粥)
著名点评
著名点评
帖子互动: 389
帖子: 3807
注册时间: 2023年 11月 24日 08:33

#14 Re: deepseek 把GPU需求倒退会A100时代

帖子 Dididada(香烟瓜子八宝粥) »

赖美豪中 写了: 2025年 2月 1日 09:09 当然都用啊,但是人家都是用自己的模型蒸馏,比如网页版o1-mini就是gpt4的蒸馏,只有区区8b参数,性能远低于4o,但是deepshit通过逆向工程去把市面上所有的开源蒸馏完了还蒸馏gpt,这是一个他娘的创举,lol
所以DS就是光明正大的去偷,而且还大言不惭的说我就偷你的了,怎么着?你来咬我啊?
x1 图片
GAGAMA
见习作家
见习作家
帖子互动: 52
帖子: 430
注册时间: 2022年 8月 27日 01:44

#15 Re: deepseek 把GPU需求倒退会A100时代

帖子 GAGAMA »

我要是老黄我也不会反驳

这种假设应用需求不变,效率提高100倍,所以得出结论算力需求只要原来1/100的逻辑,在众多文科product managers里面确实比较流行

举个例子,曾今有一堆科学家根据人类技术发展速度,预测2000年起全世界就再也不会有饥荒

jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂
上次由 GAGAMA 在 2025年 2月 1日 09:21 修改。
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3548
帖子: 41555
注册时间: 2022年 9月 6日 12:50

#16 Re: deepseek 把GPU需求倒退会A100时代

帖子 赖美豪中(my pronouns: ha/ha) »

当然不是正大光明,Deepshit逆向工程显然违反了gpt的term. 只能说openai这个公司因为太小缺少合格的cybersecurity团队,反而是微软的azure团队发现了以后通知了openai
Dididada 写了: 2025年 2月 1日 09:14 所以DS就是光明正大的去偷,而且还大言不惭的说我就偷你的了,怎么着?你来咬我啊?
x2 图片
If printing money would end poverty, printing diplomas would end stupidity.
Dididada(香烟瓜子八宝粥)
著名点评
著名点评
帖子互动: 389
帖子: 3807
注册时间: 2023年 11月 24日 08:33

#17 Re: deepseek 把GPU需求倒退会A100时代

帖子 Dididada(香烟瓜子八宝粥) »

赖美豪中 写了: 2025年 2月 1日 09:17 当然不是正大光明,Deepshit逆向工程显然违反了gpt的term. 只能说openai这个公司因为太小缺少合格的cybersecurity团队,反而是微软的azure团队发现了以后通知了openai
那它吹嘘自己不到6million美刀就实现了模型开发的目的?就是为了做空女大?
赖美豪中(my pronouns: ha/ha)
论坛元老
论坛元老
2023年度优秀版主
帖子互动: 3548
帖子: 41555
注册时间: 2022年 9月 6日 12:50

#18 Re: deepseek 把GPU需求倒退会A100时代

帖子 赖美豪中(my pronouns: ha/ha) »

同胞的pua技术你懂的。
Dididada 写了: 2025年 2月 1日 09:25 那它吹嘘自己不到6million美刀就实现了模型开发的目的?就是为了做空女大?
x1 图片
If printing money would end poverty, printing diplomas would end stupidity.
lsheng
论坛元老
论坛元老
帖子互动: 578
帖子: 25241
注册时间: 2022年 10月 11日 15:41

#19 Re: deepseek 把GPU需求倒退会A100时代

帖子 lsheng »

jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂
可是一台h100就顶16台a100, 还是更省电,省钱。算力高,效率高永远更好。
x1 图片
拿钱发帖带节奏的死全家
maxthon
正式写手
正式写手
帖子互动: 19
帖子: 196
注册时间: 2022年 8月 24日 07:57

#20 Re: deepseek 把GPU需求倒退会A100时代

帖子 maxthon »

你一定是误解了deepseek只做了蒸馏,对算力的要求才低。如果没有openAI的大模型,deepseek就没法蒸馏。
而得到openAI的大模型,如果不靠偷,即使知道算法,没有nvda的GPU也是不行的。
nvda的股价不振是因为商务部估计会严格控制它的GPU出口,彻底封死中国市场,不是deepseek有什么划时代的突破。
jiml 写了: 2025年 2月 1日 01:29 deepseek对算力的要求大约是openAI的 1/16

deepseek让ai计算中心瞬间冗余出来15/16的算力,原来1片英伟达b200做的事,现在1片a100可以做到了

嗯,英伟达股票还得跌,跌回a100时代,或者跌至最高点的1/16,一股10刀乐。难怪啊,老黄一语不发,保持沉默 🙃😂
x3 图片
回复

回到 “股海弄潮(Stock)”