分页: 1 / 1
#1 AlphaGeometry 2
发表于 : 2025年 2月 16日 12:05
由 TheMatrix
看了。很不错。
这个相当于LLM指导下的symbolic试探。
如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。
下一步的方向应该是进一步压缩symbolic engine的主动权。
#2 Re: AlphaGeometry 2
发表于 : 2025年 2月 16日 12:06
由 TheMatrix
#3 Re: AlphaGeometry 2
发表于 : 2025年 2月 16日 13:10
由 TheMatrix
TheMatrix 写了: 2025年 2月 16日 12:05
看了。很不错。
这个相当于LLM指导下的symbolic试探。
如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。
下一步的方向应该是进一步压缩symbolic engine的主动权。
这个模型分两部分,LLM和symbolic engine。
训练发生在LLM上,symbolic engine没有训练(神经网络意义的训练)。
LLM的作用主要是给symbolic engine提示画辅助线。一个提示不行再换一个提示。
这应该看成是在LLM指导下的一种工作方式。symbolic engine看成是工具。arxiv的paper我看了,似乎并没有强调这一点。不过deepmind网站的那篇和nature的那篇这一点还是清楚的。
LLM的训练数据是电脑生成的,也是用这个symbolic engine生成的好像,用以训练LLM以提出画辅助线的方法。
LLM还有一个作用是把问题从自然语言翻译成symbolic engine 接受的 formal语言。
#4 Re: AlphaGeometry 2
发表于 : 2025年 2月 16日 13:22
由 TheMatrix
1.人工supervised learning --> 2.机器supervised learning --> 3.reinforcement learning
一个领域问题的解决大概就是这个路径。而1是突破口。
因为怎么准备supervised learning数据就是最大的问题,没有idea就没法准备。有了idea就算突破了。(当然,idea得有效果)。
#5 Re: AlphaGeometry 2
发表于 : 2025年 2月 17日 11:33
由 Caravel
TheMatrix 写了: 2025年 2月 16日 12:05
看了。很不错。
这个相当于LLM指导下的symbolic试探。
如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。
下一步的方向应该是进一步压缩symbolic engine的主动权。
国产版本也有了
国产AI几何模型性能达IMO金牌水平,打平谷歌DeepMind最新AlphaGeometry系列——
TongGeometry,使用的策略网络和价值网络还来自微调版本的DeepSeek-Coder。
它能解决IMO-AG-30题中的所有30题,在IMO-AG-50上也能解决42题,而人类金牌选手平均水平分别为:25.9、40.9。
TongGeometry不仅能解题还会出题,所出的题目甚至获得了权威数学竞赛认可。
就在去年全国高中数学联赛预赛北京地区的考试中,就有TongGeometry出的几何题;由美国IMO竞赛教练组组织的一项美国民间数学竞赛USEMO,也收录了TongGeometry出的两道几何题在他们的竞赛短表中。
TongGeometry由北京通用人工智能研究院打造,下文是更多细节。