不需要deepshit女大也是走在自由落体的路上
版主: 牛河梁, alexwlt1024
#1 不需要deepshit女大也是走在自由落体的路上
本质上来说人类上的organic数据都已经收集完了,从训练的角度上其实早就饱和了。没有新数据大规模训练提升只能依靠各类大模型互相喂屎,所以从头训练的需求已经急跌。本来大家忽悠的方向是各大企业还需要MOE,这是主流市场。但是这个对gpu的需求明显还是下降的
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
x1
x1


If printing money would end poverty, printing diplomas would end stupidity.
#2 Re: 不需要deepshit女大也是走在自由落体的路上
就和当初全球跑基因序列差不多的意思。
x1

There are two ways to conquer and enslave a country. One is by the sword. The other is by debt. - John Adams
#3 Re: 不需要deepshit女大也是走在自由落体的路上
所以这也是老黄急吼吼推出个人ai电脑的原因?赖美豪中 写了: 2025年 2月 1日 09:23 本质上来说人类上的organic数据都已经收集完了,从训练的角度上其实早就饱和了。没有新数据大规模训练提升只能依靠各类大模型互相喂屎,所以从头训练的需求已经急跌。本来大家忽悠的方向是各大企业还需要MOE,这是主流市场。但是这个对gpu的需求明显还是下降的
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
x1

#4 Re: 不需要deepshit女大也是走在自由落体的路上
显然,你到现在都没看懂为啥meta宁可把自己几十b开发的ollama拉出来给你们白嫖么?想一下对比msft,google,amazon, meta没有的是什么业务?cloud么,meta没法通过卖算力赚钱,他就必须把你们的锅也砸掉啊
x1

If printing money would end poverty, printing diplomas would end stupidity.
#5 Re: 不需要deepshit女大也是走在自由落体的路上
老黄这不是成了“全民公敌”?赖美豪中 写了: 2025年 2月 1日 09:33 显然,你到现在都没看懂为啥meta宁可把自己几十b开发的ollama拉出来给你们白嫖么?想一下对比msft,google,amazon, meta没有的是什么业务?cloud么,meta没法通过卖算力赚钱,他就必须把你们的锅也砸掉啊
看来小扎真不是个好鸟
x1

#7 Re: 不需要deepshit女大也是走在自由落体的路上
未必,要看大模型的使用方向,在某些方向上,新数据还是每天不断产生的,比如金融市场。从目前的算法上讲,大模型还是要不定期的重新训练才能保持最好的结果。如果将来算法有所突破,可以完美控制大模型局部增强训练。那才会像你说得那样,对算力的要求大大降低。
赖美豪中 写了: 2025年 2月 1日 09:23 本质上来说人类上的organic数据都已经收集完了,从训练的角度上其实早就饱和了。没有新数据大规模训练提升只能依靠各类大模型互相喂屎,所以从头训练的需求已经急跌。本来大家忽悠的方向是各大企业还需要MOE,这是主流市场。但是这个对gpu的需求明显还是下降的
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
x1

#8 Re: 不需要deepshit女大也是走在自由落体的路上
time series数据不是organic数据,对LLM没有用啊
maxthon 写了: 2025年 2月 1日 09:52 未必,要看大模型的使用方向,在某些方向上,新数据还是每天不断产生的,比如金融市场。从目前的算法上讲,大模型还是要不定期的重新训练才能保持最好的结果。如果将来算法有所突破,可以完美控制大模型局部增强训练。那才会像你说得那样,对算力的要求大大降低。
If printing money would end poverty, printing diplomas would end stupidity.
#9 Re: 不需要deepshit女大也是走在自由落体的路上
个人用ai, 已经从nvda出来了。 你不需要deepseek, 你可以用利用已经有的datacenter, 从中提取出自己的ai 应用程序和agent.赖美豪中 写了: 2025年 2月 1日 09:23 本质上来说人类上的organic数据都已经收集完了,从训练的角度上其实早就饱和了。没有新数据大规模训练提升只能依靠各类大模型互相喂屎,所以从头训练的需求已经急跌。本来大家忽悠的方向是各大企业还需要MOE,这是主流市场。但是这个对gpu的需求明显还是下降的
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
以后会有数以亿记的deepseek这种小作坊, 有用的program会多如牛毛。 但领域的前进,humanoid robots, 自动驾驶,大型计算, 数据中心等还是要指望nvda和很多semiconductors 公司。
x1

#11 Re: 不需要deepshit女大也是走在自由落体的路上
你说的好像世界上不需要半导体公司了一样。是不是这个领域已经到顶了?赖美豪中 写了: 2025年 2月 1日 09:23 本质上来说人类上的organic数据都已经收集完了,从训练的角度上其实早就饱和了。没有新数据大规模训练提升只能依靠各类大模型互相喂屎,所以从头训练的需求已经急跌。本来大家忽悠的方向是各大企业还需要MOE,这是主流市场。但是这个对gpu的需求明显还是下降的
但是deepshit证明的一件事就是MOE可能用笔记本都能跑起来,性能让你完全体验不到差距。这才是女大加速垮台的原因
Deepseek不会对nvda和ai带来危险。 真正的危险
x1

#15 Re: 不需要deepshit女大也是走在自由落体的路上
量子计算突破加密算法后,谁都可以造假BTC
There are two ways to conquer and enslave a country. One is by the sword. The other is by debt. - John Adams