现在的AI还是有non trivial的东西

版主: hci

头像
omicron
论坛点评
论坛点评
帖子互动: 80
帖子: 3125
注册时间: 2022年 7月 26日 16:25

#41 Re: 现在的AI还是有non trivial的东西

帖子 omicron »

考试是最适合现在AI模型的

所以几乎各个AI模型,每次都不约而同去考试
头像
omicron
论坛点评
论坛点评
帖子互动: 80
帖子: 3125
注册时间: 2022年 7月 26日 16:25

#42 Re: 现在的AI还是有non trivial的东西

帖子 omicron »

AI 能取代河北衡水的高考工厂吗
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 535
帖子: 24110
注册时间: 2022年 7月 24日 17:21

#43 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

cover 写了: 2025年 7月 2日 23:18 各大厂让AI做这么多考试干嘛?

难道是为了替代考生,让AI代考?

因为是刷题AI,考试最擅长,所以各个大厂热衷让AI考试
我已经查到了,是去年的新闻,AI这一年真是进步神速,2024没有一个及格,今年都是140多分

这也说明高考数学比SAT难多了
头像
omicron
论坛点评
论坛点评
帖子互动: 80
帖子: 3125
注册时间: 2022年 7月 26日 16:25

#44 Re: 现在的AI还是有non trivial的东西

帖子 omicron »

考试都是有套路的

AI用了一年时间,在考试套路上有很大进步,就是刷题比较成熟了

我发现AI现在虽然在leetcode上能做有算法难题,但是如果没有现成算法的容易题,AI就不会

就是没有套路的考试,AI就不会
stm32
著名点评
著名点评
帖子互动: 89
帖子: 3960
注册时间: 2022年 7月 26日 12:34

#45 Re: 现在的AI还是有non trivial的东西

帖子 stm32 »

LLM到底会解数学题吗?

https://zhuanlan.zhihu.com/p/23573501218

我还是先给个结论,LLM并不会做数学题,它能做出来纯粹是题海战术

解释一下这个论文的验证方法

就是对原始问题进行修改和干预,也不是乱干预,是真的改到看似差不多,但是解法应该完全不同的题

干预的方式分为simple和hard

simple就是简单干预,比如分母x+1,它给改成x+2

hard干预就是猛干,比如把第一题的x+1的分母给改成x

你可别小看x+1变x+2和x,这可是完全不同

拿第一题举例子,x+1变x+2但是解体方法其实还是因式分解对吧

但是你要改x,你能因式分解吗?

你得上Cauchy-Schwarz Inequality来整

对于大模型的pretrain数据,如果它有 CSI的能力,或者说以前见过这种题型狠多

第一:知识学到了

第二:内化推理激发出来了

那它就可以做

但是,如果没有(可能math500的这种训练集里面,还是因式分解多一点),那它是不是不做?

还真不是,结果就是它死犟,按着因式分解的类似的COT给你硬来


结果就是做错

总结一下,就是模型肯定是可以学到训练集里解决问题的技巧,也就是COT范式,COT也是有范式的,或者说学到了解决问题的思路,但是它总是盲目的使用,也不去考虑比如类似问题被修改了以后,还用这套COT范式,是不是合适
stm32
著名点评
著名点评
帖子互动: 89
帖子: 3960
注册时间: 2022年 7月 26日 12:34

#47 Re: 现在的AI还是有non trivial的东西

帖子 stm32 »

用刷题的AI做自动驾驶是最危险的

貌似比用规则的自动驾驶好,大部分情况可能如此,但是谁知道啥时候路上出现偏题怪题,不在刷题范围的路况

这时候刷题AI肯定乱来,规则的AI可能呆住不动。

而自动驾驶都是电车,一个事故,司机都是烧死,大部分情况,根本来不及逃
stm32
著名点评
著名点评
帖子互动: 89
帖子: 3960
注册时间: 2022年 7月 26日 12:34

#48 Re: 现在的AI还是有non trivial的东西

帖子 stm32 »

LLM其实做数学题也是玩概率

那有人就说那为什么O系列,R1啥的能提升不少数学能力呢?那是因为它学到了pattern,或者不一样的COT pattern,随着你的训练方法更有效,它就能学到,为什么能学到?

看下面这个论文


图片

简单说这文章干啥了就可以了

就是把一些COT的思考范式,给内聚成一系列pattern,好像500个

然后把COT的pattern也给训到模型里

这样模型就知道啥问题,用哪个COT pattern去解了

就这么简单

但是思路挺牛B啊

这其实是啥啊?

这不就是把连续的动作空间,给变成离散的了吗?变成离散的,有限的空间,你就好训练啊

至于文章说用什么mcts,BON还是文章自己的训,我到觉得都不重要,mcts+个reward model的变形一样可以训,只要你把COT的pattern给内化到模型里,基本就可以干这个事了

那么推理的时候

第一反应是读完题,看你这个题符合我哪种COT pattern,然后按着这个来解你,我说的够简单了吧?

消融也多少做了些,在每个size的模型上,都能看到进步,虽然也只是数学,因为也没训别的东西

但是我认为把pattern给训进去,解别的场景也会有涌现的,就看多与少了,因为数学题套路,500个的话,其实就不少了

至于说它是gemini抽数做的,还是怎么合成的,不重要,你能弄出来500个就行
头像
omicron
论坛点评
论坛点评
帖子互动: 80
帖子: 3125
注册时间: 2022年 7月 26日 16:25

#49 Re: 现在的AI还是有non trivial的东西

帖子 omicron »

leetcode编程解题应该是一样的

算法pattern应该没有数学500个,人类研究出来的大概2-300个

所以leetcode没有使用现有算法的,要自己简单弄一个的,它就不会

这就是按照出题老师套路刷题,河北衡水技校,诸位小时候高中就是干这个,不过没有电脑高效

是衡水技校老师总结出题规律,然后拿题给你们做
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 535
帖子: 24110
注册时间: 2022年 7月 24日 17:21

#50 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

stm32 写了: 昨天 09:22 LLM其实做数学题也是玩概率

那有人就说那为什么O系列,R1啥的能提升不少数学能力呢?那是因为它学到了pattern,或者不一样的COT pattern,随着你的训练方法更有效,它就能学到,为什么能学到?

看下面这个论文


图片

简单说这文章干啥了就可以了

就是把一些COT的思考范式,给内聚成一系列pattern,好像500个

然后把COT的pattern也给训到模型里

这样模型就知道啥问题,用哪个COT pattern去解了

就这么简单

但是思路挺牛B啊

这其实是啥啊?

这不就是把连续的动作空间,给变成离散的了吗?变成离散的,有限的空间,你就好训练啊

至于文章说用什么mcts,BON还是文章自己的训,我到觉得都不重要,mcts+个reward model的变形一样可以训,只要你把COT的pattern给内化到模型里,基本就可以干这个事了

那么推理的时候

第一反应是读完题,看你这个题符合我哪种COT pattern,然后按着这个来解你,我说的够简单了吧?

消融也多少做了些,在每个size的模型上,都能看到进步,虽然也只是数学,因为也没训别的东西

但是我认为把pattern给训进去,解别的场景也会有涌现的,就看多与少了,因为数学题套路,500个的话,其实就不少了

至于说它是gemini抽数做的,还是怎么合成的,不重要,你能弄出来500个就行

你以为人类不是学会了一些模版?
头像
cover
著名点评
著名点评
帖子互动: 122
帖子: 3482
注册时间: 2023年 5月 9日 09:53

#51 Re: 现在的AI还是有non trivial的东西

帖子 cover »

人类大脑思考的主体是灵魂,灵魂是来自高维度空间的意识能量体

3维空间的肉体,不过是容器和载体。大脑的神经网络,不过灵魂和肉体连接,控制的感应网络,这个感应控制跨越维度,而且是一对一的,大脑对你自己灵魂,经过长期生长发展适应形成的。

灵魂就像电灯泡核心,发出光芒,光芒大小因人而异,肉体不过是灯泡外壳

有个网络流行词,aura,就是因此诞生的,因为很多人看得到这个光。佛像背后的光圈就是aura,其实每个人都有,不过没有佛的光强烈。

灵魂这个词,基本每个文明,诞生不久都会出现,因为有很多阴阳眼的人看得到,这个比例不少,起码1%的人


图片
magagop
见习点评
见习点评
帖子互动: 102
帖子: 1522
注册时间: 2024年 12月 5日 17:35

#52 Re: 现在的AI还是有non trivial的东西

帖子 magagop »

cover 写了: 2025年 7月 2日 22:38 只能搜到2年前的结果

不懂AI的門外漢就不要出來顯眼了,GPT4的成績還拿出來用?現在的GPT今非昔比,進步不止一個數量級。
Caravel楼主
论坛元老
论坛元老
Caravel 的博客
帖子互动: 535
帖子: 24110
注册时间: 2022年 7月 24日 17:21

#53 Re: 现在的AI还是有non trivial的东西

帖子 Caravel楼主 »

magagop 写了: 昨天 12:48 不懂AI的門外漢就不要出來顯眼了,GPT4的成績還拿出來用?現在的GPT今非昔比,進步不止一個數量級。
属实,就是去年做高考数学没有及格的,今年全140以上了
回复

回到 “葵花宝典(Programming)”