分页: 1 / 1

#1 AlphaGeometry 2

发表于 : 2025年 2月 16日 12:05
TheMatrix
rtyu 写了: 2025年 2月 16日 00:02 据说 AlphaGeometry 的确会自己推理,还自己生成了一亿个几何图形来发现新的几何关系(定理). 好像和LLM不是一回事。如果AlphaGeometry成功了,人类可以向AI提供一些概念和方向,AI可以自己推导出定理,但不知道AI能不能知道哪些定理是有用的。

https://deepmind.google/discover/blog/a ... -geometry/
看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。

#2 Re: AlphaGeometry 2

发表于 : 2025年 2月 16日 12:06
TheMatrix

#3 Re: AlphaGeometry 2

发表于 : 2025年 2月 16日 13:10
TheMatrix
TheMatrix 写了: 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。
这个模型分两部分,LLM和symbolic engine。

训练发生在LLM上,symbolic engine没有训练(神经网络意义的训练)。

LLM的作用主要是给symbolic engine提示画辅助线。一个提示不行再换一个提示。

这应该看成是在LLM指导下的一种工作方式。symbolic engine看成是工具。arxiv的paper我看了,似乎并没有强调这一点。不过deepmind网站的那篇和nature的那篇这一点还是清楚的。

LLM的训练数据是电脑生成的,也是用这个symbolic engine生成的好像,用以训练LLM以提出画辅助线的方法。

LLM还有一个作用是把问题从自然语言翻译成symbolic engine 接受的 formal语言。

#4 Re: AlphaGeometry 2

发表于 : 2025年 2月 16日 13:22
TheMatrix
1.人工supervised learning --> 2.机器supervised learning --> 3.reinforcement learning

一个领域问题的解决大概就是这个路径。而1是突破口。

因为怎么准备supervised learning数据就是最大的问题,没有idea就没法准备。有了idea就算突破了。(当然,idea得有效果)。

#5 Re: AlphaGeometry 2

发表于 : 2025年 2月 17日 11:33
Caravel
TheMatrix 写了: 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。
国产版本也有了

国产AI几何模型性能达IMO金牌水平,打平谷歌DeepMind最新AlphaGeometry系列——

TongGeometry,使用的策略网络和价值网络还来自微调版本的DeepSeek-Coder。

它能解决IMO-AG-30题中的所有30题,在IMO-AG-50上也能解决42题,而人类金牌选手平均水平分别为:25.9、40.9。

TongGeometry不仅能解题还会出题,所出的题目甚至获得了权威数学竞赛认可。

就在去年全国高中数学联赛预赛北京地区的考试中,就有TongGeometry出的几何题;由美国IMO竞赛教练组组织的一项美国民间数学竞赛USEMO,也收录了TongGeometry出的两道几何题在他们的竞赛短表中。

TongGeometry由北京通用人工智能研究院打造,下文是更多细节。