李飞飞打脸Deepseek

股市相关讨论

版主: 牛河梁alexwlt1024

anesthetic
知名作家
知名作家
帖子互动: 72
帖子: 796
注册时间: 2022年 8月 30日 01:02

#81 Re: 李飞飞打脸Deepseek

帖子 anesthetic »

飞飞李都说了这点小成就是基于ds给的灵感。。。

标签/Tags:
头像
ccmath
论坛精英
论坛精英
帖子互动: 380
帖子: 7276
注册时间: 2022年 9月 17日 19:18

#82 Re: 李飞飞打脸Deepseek

帖子 ccmath »

学生做的吧。但是斯坦福的学生现在比国内强不了多少。大过年的还要跟国内卷paper

xyzcrai 写了: 2025年 2月 7日 08:30 这狗屁文章做实了李飞飞水货的本质。真正的大牛根本不屑于发这种跟风蹭热点的垃圾。
x1 图片
上次由 ccmath 在 2025年 2月 7日 10:40 修改。
hahan
论坛元老
论坛元老
hahan 的博客
帖子互动: 845
帖子: 18302
注册时间: 2022年 7月 23日 23:48

#83 Re: 李飞飞打脸Deepseek

帖子 hahan »

ccmath 写了: 2025年 2月 7日 10:34 学生做的吧。但是斯坦福的学生现在比国内强不了多少人。大过年的还要跟国内卷paper
所有Engineering 都是高中毕业就能做的
Iteration 而已
现在的ai 从知识层面没有超过高中的范畴
急急如丧家之犬
忙忙似漏网之鱼
bigball
论坛支柱
论坛支柱
帖子互动: 393
帖子: 9204
注册时间: 2022年 7月 30日 02:23

#84 Re: 李飞飞打脸Deepseek

帖子 bigball »

Dididada 写了: 2025年 2月 6日 23:42 你对我这么一个网络上陌生的门外汉都这么耐心又客气,可以想见现实生活里你也是一个好人。
lol 笑抽了
图片
bigball
论坛支柱
论坛支柱
帖子互动: 393
帖子: 9204
注册时间: 2022年 7月 30日 02:23

#85 Re: 李飞飞打脸Deepseek

帖子 bigball »

anesthetic 写了: 2025年 2月 7日 10:24 飞飞李都说了这点小成就是基于ds给的灵感。。。
飞飞显然是站台d


h这也是ds开源的本意 大家
x1 图片
图片
头像
ccmath
论坛精英
论坛精英
帖子互动: 380
帖子: 7276
注册时间: 2022年 9月 17日 19:18

#86 Re: 李飞飞打脸Deepseek

帖子 ccmath »

属实。学了半天高深的数学,就为了炼丹成功以后搞几个公式装点一下paper, 证明PhD 有价值

hahan 写了: 2025年 2月 7日 10:38 所有Engineering 都是高中毕业就能做的
Iteration 而已
现在的ai 从知识层面没有超过高中的范畴
x1 图片
Dachun
知名作家
知名作家
帖子互动: 138
帖子: 1093
注册时间: 2022年 10月 2日 15:04

#87 Re: 李飞飞打脸Deepseek

帖子 Dachun »

anesthetic 写了: 2025年 2月 7日 10:24 飞飞李都说了这点小成就是基于ds给的灵感。。。
这个灵感的最高层次是直接给链接到OpenAI
anesthetic
知名作家
知名作家
帖子互动: 72
帖子: 796
注册时间: 2022年 8月 30日 01:02

#88 Re: 李飞飞打脸Deepseek

帖子 anesthetic »

Dachun 写了: 2025年 2月 7日 10:53 这个灵感的最高层次是直接给链接到OpenAI
你看paper没有,飞飞只是实现了ds所有infra enhancement中的一个而已
Dachun
知名作家
知名作家
帖子互动: 138
帖子: 1093
注册时间: 2022年 10月 2日 15:04

#89 Re: 李飞飞打脸Deepseek

帖子 Dachun »

或者链接都不需要,直接在OpenAI的页面上写着“根据量子力学的测不准原理,你正看到不是OpenAI 而是DS”
头像
macarthur(麦客)
见习点评
见习点评
帖子互动: 425
帖子: 2012
注册时间: 2024年 1月 11日 09:02

#90 Re: 李飞飞打脸Deepseek

帖子 macarthur(麦客) »

Dachun 写了: 2025年 2月 7日 10:53 这个灵感的最高层次是直接给链接到OpenAI
OpenAI说发明了从粮食酿出酒。。。

DeepSeek去OpenAI家偷偷买了两瓶低度粗酿,回家蒸馏一下,然后也宣称自己酿出了好酒,还省时省力。。。

飞飞直接买了两瓶精酿,换了个标签总cost $50
x1 图片
跳出三界外,不在五行中
Wishbone.Biao
著名写手
著名写手
帖子互动: 26
帖子: 248
注册时间: 2024年 4月 7日 18:27

#91 Re: 李飞飞打脸Deepseek

帖子 Wishbone.Biao »

DS鸟个含金量,50刀就复制了DS.这说明了DS的实际花费远低于500万,如果DS公布实际花费,怕被人揭了老底。
HouseMD 写了: 2025年 2月 6日 15:28 deepseek的论文含金量比李飞飞这个shitpaper高多了,,,
x1 图片
Wishbone.Biao
著名写手
著名写手
帖子互动: 26
帖子: 248
注册时间: 2024年 4月 7日 18:27

#92 Re: 李飞飞打脸Deepseek

帖子 Wishbone.Biao »

也顺带打了不少AI“专家”的脸,站台DS的大牛。


money 写了: 2025年 2月 6日 14:48 人家50美元搞出了一个类DS
你DS花了500万,好意思吗?


李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

今日一则关于人工智能领域的新闻引发广泛关注。据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从Google模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。”

图片

谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。

图片

国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上

“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。
x1 图片
microdsp
知名作家
知名作家
帖子互动: 49
帖子: 1119
注册时间: 2022年 7月 30日 01:59

#93 Re: 李飞飞打脸Deepseek

帖子 microdsp »

hahan 写了: 2025年 2月 7日 10:38 所有Engineering 都是高中毕业就能做的
Iteration 而已
现在的ai 从知识层面没有超过高中的范畴
扯蛋吧 藤校engineering 表示不服
去看大学学的工程课程 你就不会这样胡说
C919
论坛精英
论坛精英
帖子互动: 226
帖子: 5659
注册时间: 2023年 1月 20日 03:07

#94 Re: 李飞飞打脸Deepseek

帖子 C919 »

Trump 写了: 2025年 2月 6日 15:06 够便宜的。在我们玉米地也得这个价了。
外包到天竺,可以变成5美元
goodegg(我是大陆人)
职业作家
职业作家
帖子互动: 171
帖子: 743
注册时间: 2023年 7月 23日 03:31

#95 Re: 李飞飞打脸Deepseek

帖子 goodegg(我是大陆人) »

这个ID是楼主马甲专门给每一个质疑楼主的人。打上反对的符号。
anesthetic 写了: 2025年 2月 7日 10:56 你看paper没有,飞飞只是实现了ds所有infra enhancement中的一个而已
x1 图片
money楼主
论坛点评
论坛点评
帖子互动: 197
帖子: 2352
注册时间: 2022年 8月 4日 12:59

#96 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

你去看看墙内现在还在炒作DS
而且是国运级别的炒作
墙外已经熄火了
又一个小红书
书感到惊讶的事,书的这个帖子炸出这么多五毛。。。
goodegg 写了: 2025年 2月 8日 12:15 这个ID是楼主马甲专门给每一个质疑楼主的人。打上反对的符号。
biggestballs
著名点评
著名点评
帖子互动: 386
帖子: 3678
注册时间: 2024年 2月 5日 19:42

#97 Re: 李飞飞打脸Deepseek

帖子 biggestballs »

money 写了: 2025年 2月 8日 12:56 你去看看墙内现在还在炒作DS
而且是国运级别的炒作
墙外已经熄火了
又一个小红书
书感到惊讶的事,书的这个帖子炸出这么多五毛。。。
不过是你理解不了的事罢了,有人理解了,客观评价了,就是五毛,不少美国AI大牛对DeepSeek也是点赞的,他们也是五毛对吧
Devil doesn't need an advocate
goodegg(我是大陆人)
职业作家
职业作家
帖子互动: 171
帖子: 743
注册时间: 2023年 7月 23日 03:31

#98 Re: 李飞飞打脸Deepseek

帖子 goodegg(我是大陆人) »

说吧,你到底亏了多少,能把认知歪曲到离现实这么远也算奇葩

money 写了: 2025年 2月 8日 12:56 你去看看墙内现在还在炒作DS
而且是国运级别的炒作
墙外已经熄火了
又一个小红书
书感到惊讶的事,书的这个帖子炸出这么多五毛。。。
回复

回到 “股海弄潮(Stock)”