现在的AI还是有non trivial的东西
版主: hci
-
- 论坛元老
Caravel 的博客 - 帖子互动: 535
- 帖子: 24110
- 注册时间: 2022年 7月 24日 17:21
#44 Re: 现在的AI还是有non trivial的东西
考试都是有套路的
AI用了一年时间,在考试套路上有很大进步,就是刷题比较成熟了
我发现AI现在虽然在leetcode上能做有算法难题,但是如果没有现成算法的容易题,AI就不会
就是没有套路的考试,AI就不会
AI用了一年时间,在考试套路上有很大进步,就是刷题比较成熟了
我发现AI现在虽然在leetcode上能做有算法难题,但是如果没有现成算法的容易题,AI就不会
就是没有套路的考试,AI就不会
#45 Re: 现在的AI还是有non trivial的东西
LLM到底会解数学题吗?
https://zhuanlan.zhihu.com/p/23573501218
我还是先给个结论,LLM并不会做数学题,它能做出来纯粹是题海战术
解释一下这个论文的验证方法
就是对原始问题进行修改和干预,也不是乱干预,是真的改到看似差不多,但是解法应该完全不同的题
干预的方式分为simple和hard
simple就是简单干预,比如分母x+1,它给改成x+2
hard干预就是猛干,比如把第一题的x+1的分母给改成x
你可别小看x+1变x+2和x,这可是完全不同
拿第一题举例子,x+1变x+2但是解体方法其实还是因式分解对吧
但是你要改x,你能因式分解吗?
你得上Cauchy-Schwarz Inequality来整
对于大模型的pretrain数据,如果它有 CSI的能力,或者说以前见过这种题型狠多
第一:知识学到了
第二:内化推理激发出来了
那它就可以做
但是,如果没有(可能math500的这种训练集里面,还是因式分解多一点),那它是不是不做?
还真不是,结果就是它死犟,按着因式分解的类似的COT给你硬来
结果就是做错
总结一下,就是模型肯定是可以学到训练集里解决问题的技巧,也就是COT范式,COT也是有范式的,或者说学到了解决问题的思路,但是它总是盲目的使用,也不去考虑比如类似问题被修改了以后,还用这套COT范式,是不是合适
https://zhuanlan.zhihu.com/p/23573501218
我还是先给个结论,LLM并不会做数学题,它能做出来纯粹是题海战术
解释一下这个论文的验证方法
就是对原始问题进行修改和干预,也不是乱干预,是真的改到看似差不多,但是解法应该完全不同的题
干预的方式分为simple和hard
simple就是简单干预,比如分母x+1,它给改成x+2
hard干预就是猛干,比如把第一题的x+1的分母给改成x
你可别小看x+1变x+2和x,这可是完全不同
拿第一题举例子,x+1变x+2但是解体方法其实还是因式分解对吧
但是你要改x,你能因式分解吗?
你得上Cauchy-Schwarz Inequality来整
对于大模型的pretrain数据,如果它有 CSI的能力,或者说以前见过这种题型狠多
第一:知识学到了
第二:内化推理激发出来了
那它就可以做
但是,如果没有(可能math500的这种训练集里面,还是因式分解多一点),那它是不是不做?
还真不是,结果就是它死犟,按着因式分解的类似的COT给你硬来
结果就是做错
总结一下,就是模型肯定是可以学到训练集里解决问题的技巧,也就是COT范式,COT也是有范式的,或者说学到了解决问题的思路,但是它总是盲目的使用,也不去考虑比如类似问题被修改了以后,还用这套COT范式,是不是合适
#47 Re: 现在的AI还是有non trivial的东西
用刷题的AI做自动驾驶是最危险的
貌似比用规则的自动驾驶好,大部分情况可能如此,但是谁知道啥时候路上出现偏题怪题,不在刷题范围的路况
这时候刷题AI肯定乱来,规则的AI可能呆住不动。
而自动驾驶都是电车,一个事故,司机都是烧死,大部分情况,根本来不及逃
貌似比用规则的自动驾驶好,大部分情况可能如此,但是谁知道啥时候路上出现偏题怪题,不在刷题范围的路况
这时候刷题AI肯定乱来,规则的AI可能呆住不动。
而自动驾驶都是电车,一个事故,司机都是烧死,大部分情况,根本来不及逃
#48 Re: 现在的AI还是有non trivial的东西
LLM其实做数学题也是玩概率
那有人就说那为什么O系列,R1啥的能提升不少数学能力呢?那是因为它学到了pattern,或者不一样的COT pattern,随着你的训练方法更有效,它就能学到,为什么能学到?
看下面这个论文

简单说这文章干啥了就可以了
就是把一些COT的思考范式,给内聚成一系列pattern,好像500个
然后把COT的pattern也给训到模型里
这样模型就知道啥问题,用哪个COT pattern去解了
就这么简单
但是思路挺牛B啊
这其实是啥啊?
这不就是把连续的动作空间,给变成离散的了吗?变成离散的,有限的空间,你就好训练啊
至于文章说用什么mcts,BON还是文章自己的训,我到觉得都不重要,mcts+个reward model的变形一样可以训,只要你把COT的pattern给内化到模型里,基本就可以干这个事了
那么推理的时候
第一反应是读完题,看你这个题符合我哪种COT pattern,然后按着这个来解你,我说的够简单了吧?
消融也多少做了些,在每个size的模型上,都能看到进步,虽然也只是数学,因为也没训别的东西
但是我认为把pattern给训进去,解别的场景也会有涌现的,就看多与少了,因为数学题套路,500个的话,其实就不少了
至于说它是gemini抽数做的,还是怎么合成的,不重要,你能弄出来500个就行
那有人就说那为什么O系列,R1啥的能提升不少数学能力呢?那是因为它学到了pattern,或者不一样的COT pattern,随着你的训练方法更有效,它就能学到,为什么能学到?
看下面这个论文

简单说这文章干啥了就可以了
就是把一些COT的思考范式,给内聚成一系列pattern,好像500个
然后把COT的pattern也给训到模型里
这样模型就知道啥问题,用哪个COT pattern去解了
就这么简单
但是思路挺牛B啊
这其实是啥啊?
这不就是把连续的动作空间,给变成离散的了吗?变成离散的,有限的空间,你就好训练啊
至于文章说用什么mcts,BON还是文章自己的训,我到觉得都不重要,mcts+个reward model的变形一样可以训,只要你把COT的pattern给内化到模型里,基本就可以干这个事了
那么推理的时候
第一反应是读完题,看你这个题符合我哪种COT pattern,然后按着这个来解你,我说的够简单了吧?
消融也多少做了些,在每个size的模型上,都能看到进步,虽然也只是数学,因为也没训别的东西
但是我认为把pattern给训进去,解别的场景也会有涌现的,就看多与少了,因为数学题套路,500个的话,其实就不少了
至于说它是gemini抽数做的,还是怎么合成的,不重要,你能弄出来500个就行
#49 Re: 现在的AI还是有non trivial的东西
leetcode编程解题应该是一样的
算法pattern应该没有数学500个,人类研究出来的大概2-300个
所以leetcode没有使用现有算法的,要自己简单弄一个的,它就不会
这就是按照出题老师套路刷题,河北衡水技校,诸位小时候高中就是干这个,不过没有电脑高效
是衡水技校老师总结出题规律,然后拿题给你们做
算法pattern应该没有数学500个,人类研究出来的大概2-300个
所以leetcode没有使用现有算法的,要自己简单弄一个的,它就不会
这就是按照出题老师套路刷题,河北衡水技校,诸位小时候高中就是干这个,不过没有电脑高效
是衡水技校老师总结出题规律,然后拿题给你们做
-
- 论坛元老
Caravel 的博客 - 帖子互动: 535
- 帖子: 24110
- 注册时间: 2022年 7月 24日 17:21
#50 Re: 现在的AI还是有non trivial的东西
stm32 写了: 昨天 09:22 LLM其实做数学题也是玩概率
那有人就说那为什么O系列,R1啥的能提升不少数学能力呢?那是因为它学到了pattern,或者不一样的COT pattern,随着你的训练方法更有效,它就能学到,为什么能学到?
看下面这个论文
简单说这文章干啥了就可以了
就是把一些COT的思考范式,给内聚成一系列pattern,好像500个
然后把COT的pattern也给训到模型里
这样模型就知道啥问题,用哪个COT pattern去解了
就这么简单
但是思路挺牛B啊
这其实是啥啊?
这不就是把连续的动作空间,给变成离散的了吗?变成离散的,有限的空间,你就好训练啊
至于文章说用什么mcts,BON还是文章自己的训,我到觉得都不重要,mcts+个reward model的变形一样可以训,只要你把COT的pattern给内化到模型里,基本就可以干这个事了
那么推理的时候
第一反应是读完题,看你这个题符合我哪种COT pattern,然后按着这个来解你,我说的够简单了吧?
消融也多少做了些,在每个size的模型上,都能看到进步,虽然也只是数学,因为也没训别的东西
但是我认为把pattern给训进去,解别的场景也会有涌现的,就看多与少了,因为数学题套路,500个的话,其实就不少了
至于说它是gemini抽数做的,还是怎么合成的,不重要,你能弄出来500个就行
你以为人类不是学会了一些模版?
#51 Re: 现在的AI还是有non trivial的东西
人类大脑思考的主体是灵魂,灵魂是来自高维度空间的意识能量体
3维空间的肉体,不过是容器和载体。大脑的神经网络,不过灵魂和肉体连接,控制的感应网络,这个感应控制跨越维度,而且是一对一的,大脑对你自己灵魂,经过长期生长发展适应形成的。
灵魂就像电灯泡核心,发出光芒,光芒大小因人而异,肉体不过是灯泡外壳
有个网络流行词,aura,就是因此诞生的,因为很多人看得到这个光。佛像背后的光圈就是aura,其实每个人都有,不过没有佛的光强烈。
灵魂这个词,基本每个文明,诞生不久都会出现,因为有很多阴阳眼的人看得到,这个比例不少,起码1%的人

3维空间的肉体,不过是容器和载体。大脑的神经网络,不过灵魂和肉体连接,控制的感应网络,这个感应控制跨越维度,而且是一对一的,大脑对你自己灵魂,经过长期生长发展适应形成的。
灵魂就像电灯泡核心,发出光芒,光芒大小因人而异,肉体不过是灯泡外壳
有个网络流行词,aura,就是因此诞生的,因为很多人看得到这个光。佛像背后的光圈就是aura,其实每个人都有,不过没有佛的光强烈。
灵魂这个词,基本每个文明,诞生不久都会出现,因为有很多阴阳眼的人看得到,这个比例不少,起码1%的人

-
- 论坛元老
Caravel 的博客 - 帖子互动: 535
- 帖子: 24110
- 注册时间: 2022年 7月 24日 17:21