李飞飞打脸Deepseek

股市相关讨论

版主: 牛河梁alexwlt1024

niceG(通商宽衣)
知名作家
知名作家
帖子互动: 86
帖子: 1118
注册时间: 2022年 8月 1日 10:34

#21 Re: 李飞飞打脸Deepseek

帖子 niceG(通商宽衣) »

HouseMD 写了: 2025年 2月 6日 15:04 提炼1000个样本然后监督训练,成本是50刀,这听上去没问题啊。问题是deepseek也只是1000个样本么?
脑洞打开点,1万倍也才50w。

标签/Tags:
头像
DIYer
论坛点评
论坛点评
帖子互动: 197
帖子: 2837
注册时间: 2023年 11月 7日 13:48

#22 Re: 李飞飞打脸Deepseek

帖子 DIYer »

这就说明ds的开创性方法是可以复现的,并且成本低也不是吹牛
x1 图片
头像
redot(红薯林)
论坛元老
论坛元老
帖子互动: 547
帖子: 17575
注册时间: 2024年 7月 4日 23:40

#23 Re: 李飞飞打脸Deepseek

帖子 redot(红薯林) »

money楼主
论坛点评
论坛点评
帖子互动: 198
帖子: 2356
注册时间: 2022年 8月 4日 12:59

#24 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

说明这样的“开创性方法”没屌用
500万就是丫门随便报的一个数字,其实499万进了项目组私人腰包
因为说50美元,花街不会信
只好说个很小,但又不至于太小的数字,可以完美造成股市恐慌
一开始就说50美元,应该会被当成傻逼
一圈做空后,现在被人揭了老底
50块的魔术,想撬动3万亿资本市场
DIYer 写了: 2025年 2月 6日 18:10 这就说明ds的开创性方法是可以复现的,并且成本低也不是吹牛
x1 图片
drifter
论坛精英
论坛精英
帖子互动: 431
帖子: 7191
注册时间: 2022年 9月 1日 04:17

#25 Re: 李飞飞打脸Deepseek

帖子 drifter »

money 写了: 2025年 2月 6日 18:37 说明这样的“开创性方法”没屌用
500万就是丫门随便报的一个数字,其实499万进了项目组私人腰包
因为说50美元,花街不会信
只好说个很小,但又不至于太小的数字,可以完美造成股市恐慌
一开始就说50美元,应该会被当成傻逼
一圈做空后,现在被人揭了老底
50块的魔术,想撬动3万亿资本市场
看来花姐太弱智了 居然能活这么多年
头像
DIYer
论坛点评
论坛点评
帖子互动: 197
帖子: 2837
注册时间: 2023年 11月 7日 13:48

#26 Re: 李飞飞打脸Deepseek

帖子 DIYer »

money 写了: 2025年 2月 6日 18:37 说明这样的“开创性方法”没屌用
500万就是丫门随便报的一个数字,其实499万进了项目组私人腰包
因为说50美元,花街不会信
只好说个很小,但又不至于太小的数字,可以完美造成股市恐慌
一开始就说50美元,应该会被当成傻逼
一圈做空后,现在被人揭了老底
50块的魔术,想撬动3万亿资本市场
ds可能就是花了500万,因为现在的更低成本是建立在ds的基础上的。
头像
mmking(上水)
论坛支柱
论坛支柱
帖子互动: 1315
帖子: 9502
注册时间: 2023年 1月 25日 05:10

#27 Re: 李飞飞打脸Deepseek

帖子 mmking(上水) »

传导到open AI那就是个雷啊
money 写了: 2025年 2月 6日 14:48 人家50美元搞出了一个类DS
你DS花了500万,好意思吗?


李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

今日一则关于人工智能领域的新闻引发广泛关注。据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从Google模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。”

图片

谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。

图片

国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上

“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。
这个煎饼多少钱? :D viewtopic.php?t=833307

凡所有相,皆是虚妄

图片
money楼主
论坛点评
论坛点评
帖子互动: 198
帖子: 2356
注册时间: 2022年 8月 4日 12:59

#28 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

请不要随口乱喷
去看论文
俺已经把飞飞姐的论文部分贴上面了
1)RL方法各家都再用,DS不是idea原创
2)RL方法都不是从0开始训练
3)DS做了一些工作,效果比较好
4)飞飞姐的工作不是基于DS,而且更小资源达到差不多效果
5)飞飞姐的目的显然不是做空,因为这个idea聊胜于无。被强国别有用心的人拿来做空美股,甚至上升到国运高度,就是强国人的用心险恶之处了
DIYer 写了: 2025年 2月 6日 19:28 ds可能就是花了500万,因为现在的更低成本是建立在ds的基础上的。
x1 图片
诺华老药工
著名点评
著名点评
帖子互动: 353
帖子: 3876
注册时间: 2024年 2月 16日 09:08

#29 Re: 李飞飞打脸Deepseek

帖子 诺华老药工 »

李飞飞团队为何李飞飞署名在正数第五(倒数第六)?
观自在菩萨行深般若波罗蜜多时照见五蕴皆空度一切苦厄舍利子色不异空空不异色色即是空空即是色受想识亦复如是舍利子是诸法空相不生不灭不垢不淨不增不减是故空中无色无受想行识无眼耳鼻舌身意无色声香味触法无眼界乃至无意识界无无明亦无无明尽乃至无老死亦无老死尽无苦集灭道无智亦无得以无所得故菩提萨埵依般若波罗蜜多故心无罣碍无罣碍故无有恐怖远离颠倒梦想究竟涅槃三世诸佛依般若波罗蜜多故得阿耨多罗三藐三菩提故知般若波罗蜜多是大神咒是大明咒是无上咒是无等等咒能除一切苦真实不虚咒曰揭谛揭谛波罗揭谛波罗僧揭谛菩提萨婆诃
头像
mmking(上水)
论坛支柱
论坛支柱
帖子互动: 1315
帖子: 9502
注册时间: 2023年 1月 25日 05:10

#30 Re: 李飞飞打脸Deepseek

帖子 mmking(上水) »

这个楼是开源的楼,就不一样了

第一次盖的时候挺累,后面就…
randomforest 写了: 2025年 2月 6日 15:32 打个屁的脸,一个是建了一座楼,一个是装修了一座楼的一个窗户,老逼将能理解吗?
这个煎饼多少钱? :D viewtopic.php?t=833307

凡所有相,皆是虚妄

图片
头像
DIYer
论坛点评
论坛点评
帖子互动: 197
帖子: 2837
注册时间: 2023年 11月 7日 13:48

#31 Re: 李飞飞打脸Deepseek

帖子 DIYer »

money 写了: 2025年 2月 6日 19:42 请不要随口乱喷
去看论文
俺已经把飞飞姐的论文部分贴上面了
1)RL方法各家都再用,DS不是idea原创
2)RL方法都不是从0开始训练
3)DS做了一些工作,效果比较好
4)飞飞姐的工作不是基于DS,而且更小资源达到差不多效果
5)飞飞姐的目的显然不是做空,因为这个idea聊胜于无。被强国别有用心的人拿来做空美股,甚至上升到国运高度,就是强国人的用心险恶之处了
说得容易,没ds之前怎么没人能做出这么好的?飞飞就算不是基于ds,也是用的ds用的办法。ds把这条路走痛了,有人就来说不新鲜,可以走得更好。
x1 图片
money楼主
论坛点评
论坛点评
帖子互动: 198
帖子: 2356
注册时间: 2022年 8月 4日 12:59

#32 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

给五毛科普:PI和千老的区别
论文作者,杀老鼠的千老还是要排第一位的,PI往后排
诺华老药工 写了: 2025年 2月 6日 19:45 李飞飞团队为何李飞飞署名在正数第五(倒数第六)?
上次由 money 在 2025年 2月 6日 19:52 修改。
money楼主
论坛点评
论坛点评
帖子互动: 198
帖子: 2356
注册时间: 2022年 8月 4日 12:59

#33 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

因为根本没人这么玩。。。

DS吹的牛逼不是说他比ChatGPT强
而是他花了别人2%的成本搞出了相同的东西
花姐的三观就崩塌了

最后发现是个聊胜于无的东西
最后人家,不管是花2%,还是花0.000002%的成本,都可以搞出来一个推理模型
可是对AI发展有屁用呢

AI大基建根本不会鸟这样“聊胜于无”的“成果”
AI训练还得老老实实从0做起
DIYer 写了: 2025年 2月 6日 19:48 说得容易,没ds之前怎么没人能做出这么好的?飞飞就算不是基于ds,也是用的ds用的办法。ds把这条路走痛了,有人就来说不新鲜,可以走得更好。
头像
DIYer
论坛点评
论坛点评
帖子互动: 197
帖子: 2837
注册时间: 2023年 11月 7日 13:48

#34 Re: 李飞飞打脸Deepseek

帖子 DIYer »

money 写了: 2025年 2月 6日 19:52 因为根本没人这么玩。。。

DS吹的牛逼不是说他比ChatGPT强
而是他花了别人2%的成本搞出了相同的东西
花姐的三观就崩塌了

最后发现是个聊胜于无的东西
最后人家,不管是花2%,还是花0.000002%的成本,都可以搞出来一个推理模型
可是对AI发展有屁用呢

AI大基建根本不会鸟这样“聊胜于无”的“成果”
AI训练还得老老实实从0做起
现在不需要再从头训练了吧,再从头训练不是浪费吗?或者说算法有问题,不能利用之前的结果。
Jason6278(JJ)
论坛点评
论坛点评
帖子互动: 608
帖子: 2450
注册时间: 2024年 5月 16日 23:20

#35 Re: 李飞飞打脸Deepseek

帖子 Jason6278(JJ) »

很好,一盒鸡蛋的价格
tlihz
小有名气
小有名气
帖子互动: 1
帖子: 41
注册时间: 2022年 11月 3日 03:04

#36 Re: 李飞飞打脸Deepseek

帖子 tlihz »

李飞飞,除了最早搞了个imagenet比赛,再就没有什么有影响力的共享

她最大的标签可能就是 女AI科学家
drifter 写了: 2025年 2月 6日 15:18 李飞飞也来蹭热度 看来自己没啥真货?
money楼主
论坛点评
论坛点评
帖子互动: 198
帖子: 2356
注册时间: 2022年 8月 4日 12:59

#37 Re: 李飞飞打脸Deepseek

帖子 money楼主 »

你盯着别人桶里钓的鱼,二次蒸馏
不说有版权问题
万一人家哪天不开放源码了,你就死翘翘了
美帝的大科技养那么多AI技术人才,会这么傻逼地玩这种投机取巧的方法吗?

只不过这次DS闹太大(再次感叹憋的做空能力,和五毛众口铄金的本事)
惊动了万亿资本市场
飞飞姐出来说句公道话而已

对了,飞飞姐是老黄的垫基石。
最开始Hinton的工作就是在飞飞姐的图像数据库上做的
导致后面一连串革命

不要小看飞飞姐的工作

再次证明,DS就是类似小红书一样的玩意
热门了不到两周,就被打回原形了
DIYer 写了: 2025年 2月 6日 19:55 现在不需要再从头训练了吧,再从头训练不是浪费吗?或者说算法有问题,不能利用之前的结果。
诺华老药工
著名点评
著名点评
帖子互动: 353
帖子: 3876
注册时间: 2024年 2月 16日 09:08

#38 Re: 李飞飞打脸Deepseek

帖子 诺华老药工 »

五毛PI倒数第六?
money 写了: 2025年 2月 6日 19:49 给五毛科普:PI和千老的区别
论文作者,杀老鼠的千老还是要排第一位的,PI往后排
观自在菩萨行深般若波罗蜜多时照见五蕴皆空度一切苦厄舍利子色不异空空不异色色即是空空即是色受想识亦复如是舍利子是诸法空相不生不灭不垢不淨不增不减是故空中无色无受想行识无眼耳鼻舌身意无色声香味触法无眼界乃至无意识界无无明亦无无明尽乃至无老死亦无老死尽无苦集灭道无智亦无得以无所得故菩提萨埵依般若波罗蜜多故心无罣碍无罣碍故无有恐怖远离颠倒梦想究竟涅槃三世诸佛依般若波罗蜜多故得阿耨多罗三藐三菩提故知般若波罗蜜多是大神咒是大明咒是无上咒是无等等咒能除一切苦真实不虚咒曰揭谛揭谛波罗揭谛波罗僧揭谛菩提萨婆诃
biggestballs
著名点评
著名点评
帖子互动: 397
帖子: 3725
注册时间: 2024年 2月 5日 19:42

#39 Re: 李飞飞打脸Deepseek

帖子 biggestballs »

诺华老药工 写了: 2025年 2月 6日 20:09 五毛PI倒数第六?
你是药工但不是PhD?问出这么外行的问题,读过硕士的药工也不应该问出这种问题啊
Devil doesn't need an advocate
头像
wmysh(我没有啥好)
著名点评
著名点评
帖子互动: 688
帖子: 4818
注册时间: 2023年 3月 10日 20:59
来自: Ex medio nullis locis

#40 Re: 李飞飞打脸Deepseek

帖子 wmysh(我没有啥好) »

drifter 写了: 2025年 2月 6日 18:48 看来花姐太弱智了 居然能活这么多年
花街的平均智商肯定比这个论坛的访客低。
人家是用情商炒股。
There are two ways to conquer and enslave a country. One is by the sword. The other is by debt. - John Adams
回复

回到 “股海弄潮(Stock)”