新未名空间

rtyu 写了： 2025年 2月 16日 00:02 据说 AlphaGeometry 的确会自己推理，还自己生成了一亿个几何图形来发现新的几何关系(定理). 好像和LLM不是一回事。如果AlphaGeometry成功了，人类可以向AI提供一些概念和方向，AI可以自己推导出定理，但不知道AI能不能知道哪些定理是有用的。

https://deepmind.google/discover/blog/a ... -geometry/

看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话，symbolic engine看成是工具，这个模型相当于把LLM和工具集成到了一体，也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。

https://deepmind.google/discover/blog/a ... -geometry/
https://www.nature.com/articles/s41586-023-06747-5
https://arxiv.org/html/2502.03544v1

TheMatrix 写了： 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话，symbolic engine看成是工具，这个模型相当于把LLM和工具集成到了一体，也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。

这个模型分两部分，LLM和symbolic engine。

训练发生在LLM上，symbolic engine没有训练（神经网络意义的训练）。

LLM的作用主要是给symbolic engine提示画辅助线。一个提示不行再换一个提示。

这应该看成是在LLM指导下的一种工作方式。symbolic engine看成是工具。arxiv的paper我看了，似乎并没有强调这一点。不过deepmind网站的那篇和nature的那篇这一点还是清楚的。

LLM的训练数据是电脑生成的，也是用这个symbolic engine生成的好像，用以训练LLM以提出画辅助线的方法。

LLM还有一个作用是把问题从自然语言翻译成symbolic engine 接受的 formal语言。

1.人工supervised learning --> 2.机器supervised learning --> 3.reinforcement learning

一个领域问题的解决大概就是这个路径。而1是突破口。

因为怎么准备supervised learning数据就是最大的问题，没有idea就没法准备。有了idea就算突破了。（当然，idea得有效果）。

TheMatrix 写了： 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话，symbolic engine看成是工具，这个模型相当于把LLM和工具集成到了一体，也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。

国产版本也有了

国产AI几何模型性能达IMO金牌水平，打平谷歌DeepMind最新AlphaGeometry系列——

TongGeometry，使用的策略网络和价值网络还来自微调版本的DeepSeek-Coder。

它能解决IMO-AG-30题中的所有30题，在IMO-AG-50上也能解决42题，而人类金牌选手平均水平分别为：25.9、40.9。

TongGeometry不仅能解题还会出题，所出的题目甚至获得了权威数学竞赛认可。

就在去年全国高中数学联赛预赛北京地区的考试中，就有TongGeometry出的几何题；由美国IMO竞赛教练组组织的一项美国民间数学竞赛USEMO，也收录了TongGeometry出的两道几何题在他们的竞赛短表中。

TongGeometry由北京通用人工智能研究院打造，下文是更多细节。

新未名空间

AlphaGeometry 2

#1 AlphaGeometry 2

#2 Re: AlphaGeometry 2

#3 Re: AlphaGeometry 2

#4 Re: AlphaGeometry 2

#5 Re: AlphaGeometry 2