想到了目前LLM训练的一个巨大瑕疵

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 15:08

回顾大模型训练的历史是

先预训练一个巨大的language model
然后再训练来对话2022年出现ChatGPT
然后2024年出现长链推理的推理模型

但是人则不是这样，
小孩没有学习所有的词汇，
再去学习说话和推理
而是先学了几个词，就开始说话，然后大人再多教一些
再多学会一点，推理更强一点。
这样的好处是模型可以保持学习新的东西。

我猜测未来几年，会有人探索在小预训练模型上面训练推理能力。我认为小模型也可以推理。就像小孩一样，虽然有点childish，但是也可以有回溯反思。推理能力甚至在语言之前就有。

wdong

你说的这些问题都有人在探索。搜TinyStories。但是就像另外一个帖子讨论的，人其实并没有多少逻辑思维和reasoning的能力，对于大方向在哪儿绝大多数人是没感觉的，只能乱碰乱撞，偶尔撞上了再回过头来圆故事。大多数人不但没有思维能力，而且眼界狭窄，而且还很短视，只愿意干明确见得到好处的方向，很多东西碰一下就完了不往下挖了。其实开挖的时候本来也就是只想碰一下而已。所以科学发展会这么难。

人其实不如AI。活在人的身体里很难受。

wass · 帖子由 **wass** » 2025年 3月 2日 20:14

人是纯RL，DL将来可以一样学习，好不好不知道

wass · 帖子由 **wass** » 2025年 3月 2日 20:16

20年后，一个纽扣可以装马斯克现在的20万卡

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 21:25

wdong 写了： 2025年 3月 2日 19:28 你说的这些问题都有人在探索。搜TinyStories。但是就像另外一个帖子讨论的，人其实并没有多少逻辑思维和reasoning的能力，对于大方向在哪儿绝大多数人是没感觉的，只能乱碰乱撞，偶尔撞上了再回过头来圆故事。大多数人不但没有思维能力，而且眼界狭窄，而且还很短视，只愿意干明确见得到好处的方向，很多东西碰一下就完了不往下挖了。其实开挖的时候本来也就是只想碰一下而已。所以科学发展会这么难。

人其实不如AI。活在人的身体里很难受。

哈哈看来idea真是很cheap

我你说了看了一下tinystories，

确实是和我想的类似

但我还有一个想法就是慢慢增加词汇量

可以观察model是怎么获得新能力的

sporky · 帖子由 **sporky** » 2025年 3月 2日 21:31

wass 写了： 2025年 3月 2日 20:16 20年后，一个纽扣可以装马斯克现在的20万卡

装啥20万卡，装一万卡就可以了

TheMatrix · 帖子由 **TheMatrix** » 2025年 3月 2日 21:34

Caravel 写了： 2025年 3月 2日 15:08 回顾大模型训练的历史是

先预训练一个巨大的language model
然后再训练来对话2022年出现ChatGPT
然后2024年出现长链推理的推理模型

但是人则不是这样，
小孩没有学习所有的词汇，
再去学习说话和推理
而是先学了几个词，就开始说话，然后大人再多教一些
再多学会一点，推理更强一点。
这样的好处是模型可以保持学习新的东西。

我猜测未来几年，会有人探索在小预训练模型上面训练推理能力。我认为小模型也可以推理。就像小孩一样，虽然有点childish，但是也可以有回溯反思。推理能力甚至在语言之前就有。

大模型的训练是快速重走人类进化史。训练的结果是人类一出生就具备的。而人类小孩的学习是事例学习，和大模型训练不是一个阶段的事情，不应该类比。人类小孩的学习和大模型in-context learning可以类比一下。

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 22:04

TheMatrix 写了： 2025年 3月 2日 21:34 大模型的训练是快速重走人类进化史。训练的结果是人类一出生就具备的。而人类小孩的学习是事例学习，和大模型训练不是一个阶段的事情，不应该类比。人类小孩的学习和大模型in-context learning可以类比一下。

我认为人类进化史提供的应该是网络结构和训练方法

大部分权重都是后天学习的

但是人类的学习并不是大量预训练加强化学习

而是每天都在预训练，然后同时也强化学习

不是学习了天下所有文本在开口说话

而是边学边说一开始说话有点childish

王子公主小红帽大灰狼

渐渐学习新的东西

wdong

Caravel 写了： 2025年 3月 2日 21:25 哈哈看来idea真是很cheap

我你说了看了一下tinystories，

确实是和我想的类似

但我还有一个想法就是慢慢增加词汇量

可以观察model是怎么获得新能力的

比你说的更加先进的技术我已经想出来了。

pathdream

sporky 写了： 2025年 3月 2日 21:31 装啥20万卡，装一万卡就可以了

29个一万卡

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 22:10

wdong 写了： 2025年 3月 2日 22:08 比你说的更加先进的技术我已经想出来了。

不改预训练不行啊

我觉得目前在线学习不work的原因是预训练学的太多了

全天下的书都看过

那再多看一本进步不大了

bhold · 帖子由 **bhold** » 2025年 3月 2日 22:13

Caravel 写了： 2025年 3月 2日 15:08 但是人则不是这样，
小孩没有学习所有的词汇，
再去学习说话和推理
而是先学了几个词，就开始说话，然后大人再多教一些
再多学会一点，推理更强一点。
这样的好处是模型可以保持学习新的东西。

还有一点别忽视了
大人和小孩子很多是靠眼睛和气氛学的
所谓言传身教
有时候一个手势一个脸色比说半个小时都管用
这个是机器所完全没有的

wdong

Caravel 写了： 2025年 3月 2日 22:10 不改预训练不行啊

我觉得目前在线学习不work的原因是预训练学的太多了

全天下的书都看过

那再多看一本进步不大了

纸上得来终觉浅，绝知此事要躬行。
现在的框架不完善，但也不是那么差。基本的要素都有了。
否则不会干活。问题是还没融会贯通。提高的余地还很大。

书读得多的人会对人类的思维能力有过度的自信。但是碰到新问题一律抓瞎。现有的这些东西，都是零零星星一点一点碰出来的，并不是某个极聪明的人设计出来的。所以虽然要素都有了，其实大家都还蒙在鼓里。这就是现在的机会。每个人都可以按自己的视角去解读这些东西。1000个人10000个人去试，自然会有人找到出路。但是是这个人聪明吗？他只是运气好。

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 22:51

wdong 写了： 2025年 3月 2日 22:29 纸上得来终觉浅，绝知此事要躬行。
现在的框架不完善，但也不是那么差。基本的要素都有了。
否则不会干活。问题是还没融会贯通。提高的余地还很大。

书读得多的人会对人类的思维能力有过度的自信。但是碰到新问题一律抓瞎。现有的这些东西，都是零零星星一点一点碰出来的，并不是某个极聪明的人设计出来的。所以虽然要素都有了，其实大家都还蒙在鼓里。这就是现在的机会。每个人都可以按自己的视角去解读这些东西。1000个人10000个人去试，自然会有人找到出路。但是是这个人聪明吗？他只是运气好。

是的，哈哈，我是纸上谈兵，乱弹一起。行不行还得能训练出来结果。

wdong

Caravel 写了： 2025年 3月 2日 22:51 是的，哈哈，我是纸上谈兵，乱弹一起。行不行还得能训练出来结果。

我想说的是模型绝知要躬行。需要有关于实操的episodic memory。这是我正在做的东西，寄予厚望。所以后面岔开了。

bihai · 帖子由 **bihai** » 2025年 3月 2日 23:13

wdong 写了： 2025年 3月 2日 23:09 我想说的是模型绝知要躬行。需要有关于实操的episodic memory。这是我正在做的东西，寄予厚望。所以后面岔开了。

我最近也是悟了意识的本质

Caravel · 帖子由 **Caravel楼主** » 2025年 3月 2日 23:50

bihai 写了： 2025年 3月 2日 23:13 我最近也是悟了意识的本质

什么是意识本质？

bihai · 帖子由 **bihai** » 2025年 3月 2日 23:58

Caravel 写了： 2025年 3月 2日 23:50 什么是意识本质？

你先说说看你的理解，然后说说有没有没想通的地方。我想看看别人是怎么想的。

verdelite

wdong 写了： 2025年 3月 2日 22:08 比你说的更加先进的技术我已经想出来了。

我2018年就都想好了。如果不是为了研究没有光子这个问题，我都动手7年了。

像我这样有洞察力的人才能在2015年预测到2025年AI智能达到人类水平。智能大牛Chris Eliasmith在2015年的预测是50年。

drifter · 帖子由 **drifter** » 2025年 3月 3日 00:34

wdong 写了： 2025年 3月 2日 22:29 纸上得来终觉浅，绝知此事要躬行。
现在的框架不完善，但也不是那么差。基本的要素都有了。
否则不会干活。问题是还没融会贯通。提高的余地还很大。

书读得多的人会对人类的思维能力有过度的自信。但是碰到新问题一律抓瞎。现有的这些东西，都是零零星星一点一点碰出来的，并不是某个极聪明的人设计出来的。所以虽然要素都有了，其实大家都还蒙在鼓里。这就是现在的机会。每个人都可以按自己的视角去解读这些东西。1000个人10000个人去试，自然会有人找到出路。但是是这个人聪明吗？他只是运气好。

有道理好比年轻人能有新点子大部分发明创造都30岁前就有主意了
所以要创新比如数学应该除了语言外重零开始看看有没有突破

新未名空间

想到了目前LLM训练的一个巨大瑕疵

#1 想到了目前LLM训练的一个巨大瑕疵

#2 Re: 想到了目前LLM训练的一个巨大瑕疵

#3 Re: 想到了目前LLM训练的一个巨大瑕疵

#4 Re: 想到了目前LLM训练的一个巨大瑕疵

#5 Re: 想到了目前LLM训练的一个巨大瑕疵

#6 Re: 想到了目前LLM训练的一个巨大瑕疵

#7 Re: 想到了目前LLM训练的一个巨大瑕疵

#8 Re: 想到了目前LLM训练的一个巨大瑕疵

#9 Re: 想到了目前LLM训练的一个巨大瑕疵

#10 Re: 想到了目前LLM训练的一个巨大瑕疵

#11 Re: 想到了目前LLM训练的一个巨大瑕疵

#12 Re: 想到了目前LLM训练的一个巨大瑕疵

#13 Re: 想到了目前LLM训练的一个巨大瑕疵

#14 Re: 想到了目前LLM训练的一个巨大瑕疵

#15 Re: 想到了目前LLM训练的一个巨大瑕疵

#16 Re: 想到了目前LLM训练的一个巨大瑕疵

#17 Re: 想到了目前LLM训练的一个巨大瑕疵

#18 Re: 想到了目前LLM训练的一个巨大瑕疵

#19 Re: 想到了目前LLM训练的一个巨大瑕疵

#20 Re: 想到了目前LLM训练的一个巨大瑕疵