现在的AI还是有non trivial的东西

omicron · 帖子由 **omicron** » 2025年 7月 2日 23:29

考试是最适合现在AI模型的

所以几乎各个AI模型，每次都不约而同去考试

omicron · 帖子由 **omicron** » 2025年 7月 2日 23:31

AI 能取代河北衡水的高考工厂吗

Caravel · 帖子由 **Caravel楼主** » 2025年 7月 2日 23:32

cover 写了： 2025年 7月 2日 23:18 各大厂让AI做这么多考试干嘛？

难道是为了替代考生，让AI代考？

因为是刷题AI，考试最擅长，所以各个大厂热衷让AI考试

我已经查到了，是去年的新闻，AI这一年真是进步神速，2024没有一个及格，今年都是140多分

这也说明高考数学比SAT难多了

omicron · 帖子由 **omicron** » 2025年 7月 2日 23:40

考试都是有套路的

AI用了一年时间，在考试套路上有很大进步，就是刷题比较成熟了

我发现AI现在虽然在leetcode上能做有算法难题，但是如果没有现成算法的容易题，AI就不会

就是没有套路的考试，AI就不会

stm32 · 帖子由 **stm32** » 2025年 7月 3日 00:09

LLM到底会解数学题吗？

https://zhuanlan.zhihu.com/p/23573501218

我还是先给个结论，LLM并不会做数学题，它能做出来纯粹是题海战术

解释一下这个论文的验证方法

就是对原始问题进行修改和干预，也不是乱干预，是真的改到看似差不多，但是解法应该完全不同的题

干预的方式分为simple和hard

simple就是简单干预，比如分母x+1,它给改成x+2

hard干预就是猛干，比如把第一题的x+1的分母给改成x

你可别小看x+1变x+2和x，这可是完全不同

拿第一题举例子，x+1变x+2但是解体方法其实还是因式分解对吧

但是你要改x，你能因式分解吗？

你得上Cauchy-Schwarz Inequality来整

对于大模型的pretrain数据，如果它有 CSI的能力，或者说以前见过这种题型狠多

第一：知识学到了

第二：内化推理激发出来了

那它就可以做

但是，如果没有（可能math500的这种训练集里面，还是因式分解多一点），那它是不是不做？

还真不是，结果就是它死犟，按着因式分解的类似的COT给你硬来

结果就是做错

总结一下，就是模型肯定是可以学到训练集里解决问题的技巧，也就是COT范式，COT也是有范式的，或者说学到了解决问题的思路，但是它总是盲目的使用，也不去考虑比如类似问题被修改了以后，还用这套COT范式，是不是合适

stm32 · 帖子由 **stm32** » 2025年 7月 3日 08:28

用刷题的AI做自动驾驶是最危险的

貌似比用规则的自动驾驶好，大部分情况可能如此，但是谁知道啥时候路上出现偏题怪题，不在刷题范围的路况

这时候刷题AI肯定乱来，规则的AI可能呆住不动。

而自动驾驶都是电车，一个事故，司机都是烧死，大部分情况，根本来不及逃

stm32 · 帖子由 **stm32** » 2025年 7月 3日 09:22

LLM其实做数学题也是玩概率

那有人就说那为什么O系列，R1啥的能提升不少数学能力呢？那是因为它学到了pattern，或者不一样的COT pattern，随着你的训练方法更有效，它就能学到，为什么能学到？

看下面这个论文

简单说这文章干啥了就可以了

就是把一些COT的思考范式，给内聚成一系列pattern，好像500个

然后把COT的pattern也给训到模型里

这样模型就知道啥问题，用哪个COT pattern去解了

就这么简单

但是思路挺牛B啊

这其实是啥啊？

这不就是把连续的动作空间，给变成离散的了吗？变成离散的，有限的空间，你就好训练啊

至于文章说用什么mcts，BON还是文章自己的训，我到觉得都不重要，mcts+个reward model的变形一样可以训，只要你把COT的pattern给内化到模型里，基本就可以干这个事了

那么推理的时候

第一反应是读完题，看你这个题符合我哪种COT pattern，然后按着这个来解你，我说的够简单了吧？

消融也多少做了些，在每个size的模型上，都能看到进步，虽然也只是数学，因为也没训别的东西

但是我认为把pattern给训进去，解别的场景也会有涌现的，就看多与少了，因为数学题套路，500个的话，其实就不少了

至于说它是gemini抽数做的，还是怎么合成的，不重要，你能弄出来500个就行

omicron · 帖子由 **omicron** » 2025年 7月 3日 09:28

leetcode编程解题应该是一样的

算法pattern应该没有数学500个，人类研究出来的大概2-300个

所以leetcode没有使用现有算法的，要自己简单弄一个的，它就不会

这就是按照出题老师套路刷题，河北衡水技校，诸位小时候高中就是干这个，不过没有电脑高效

是衡水技校老师总结出题规律，然后拿题给你们做

Caravel · 帖子由 **Caravel楼主** » 2025年 7月 3日 10:11

stm32 写了： 2025年 7月 3日 09:22 LLM其实做数学题也是玩概率

那有人就说那为什么O系列，R1啥的能提升不少数学能力呢？那是因为它学到了pattern，或者不一样的COT pattern，随着你的训练方法更有效，它就能学到，为什么能学到？

看下面这个论文

简单说这文章干啥了就可以了

就是把一些COT的思考范式，给内聚成一系列pattern，好像500个

然后把COT的pattern也给训到模型里

这样模型就知道啥问题，用哪个COT pattern去解了

就这么简单

但是思路挺牛B啊

这其实是啥啊？

这不就是把连续的动作空间，给变成离散的了吗？变成离散的，有限的空间，你就好训练啊

至于文章说用什么mcts，BON还是文章自己的训，我到觉得都不重要，mcts+个reward model的变形一样可以训，只要你把COT的pattern给内化到模型里，基本就可以干这个事了

那么推理的时候

第一反应是读完题，看你这个题符合我哪种COT pattern，然后按着这个来解你，我说的够简单了吧？

消融也多少做了些，在每个size的模型上，都能看到进步，虽然也只是数学，因为也没训别的东西

但是我认为把pattern给训进去，解别的场景也会有涌现的，就看多与少了，因为数学题套路，500个的话，其实就不少了

至于说它是gemini抽数做的，还是怎么合成的，不重要，你能弄出来500个就行

你以为人类不是学会了一些模版？

cover · 帖子由 **cover** » 2025年 7月 3日 10:30

人类大脑思考的主体是灵魂，灵魂是来自高维度空间的意识能量体

3维空间的肉体，不过是容器和载体。大脑的神经网络，不过灵魂和肉体连接，控制的感应网络，这个感应控制跨越维度，而且是一对一的，大脑对你自己灵魂，经过长期生长发展适应形成的。

灵魂就像电灯泡核心，发出光芒，光芒大小因人而异，肉体不过是灯泡外壳

有个网络流行词，aura，就是因此诞生的，因为很多人看得到这个光。佛像背后的光圈就是aura，其实每个人都有，不过没有佛的光强烈。

灵魂这个词，基本每个文明，诞生不久都会出现，因为有很多阴阳眼的人看得到，这个比例不少，起码1%的人

magagop · 帖子由 **magagop** » 2025年 7月 3日 12:48

cover 写了： 2025年 7月 2日 22:38 只能搜到2年前的结果

不懂AI的門外漢就不要出來顯眼了，GPT4的成績還拿出來用？現在的GPT今非昔比，進步不止一個數量級。

Caravel · 帖子由 **Caravel楼主** » 2025年 7月 3日 17:06

magagop 写了： 2025年 7月 3日 12:48 不懂AI的門外漢就不要出來顯眼了，GPT4的成績還拿出來用？現在的GPT今非昔比，進步不止一個數量級。

属实，就是去年做高考数学没有及格的，今年全140以上了

stm32 · 帖子由 **stm32** » 2025年 7月 5日 13:22

Caravel 写了： 2025年 7月 3日 10:11 你以为人类不是学会了一些模版？

中国的高考题海战术，刷题就是学模版

高考没有考试出题模版，就没法刷题，因为没效果

高考有明显的出题模版，所以河北的刷题技校最擅长这个，学生上清华

AI就是刷题，还做了各种刷题模版，所以各个AI，一窝风去参加考试，因为这个AI最能出成绩

新未名空间

现在的AI还是有non trivial的东西

#41 Re: 现在的AI还是有non trivial的东西

#42 Re: 现在的AI还是有non trivial的东西

#43 Re: 现在的AI还是有non trivial的东西

#44 Re: 现在的AI还是有non trivial的东西

#45 Re: 现在的AI还是有non trivial的东西

#47 Re: 现在的AI还是有non trivial的东西

#48 Re: 现在的AI还是有non trivial的东西

#49 Re: 现在的AI还是有non trivial的东西

#50 Re: 现在的AI还是有non trivial的东西

#51 Re: 现在的AI还是有non trivial的东西

#52 Re: 现在的AI还是有non trivial的东西

#53 Re: 现在的AI还是有non trivial的东西

#54 Re: 现在的AI还是有non trivial的东西