AlphaGeometry 2

STEM版,合并数学,物理,化学,科学,工程,机械。不包括生物、医学相关,和计算机相关内容。

版主: verdeliteTheMatrix

回复
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 266
帖子: 13400
注册时间: 2022年 7月 26日 00:35

#1 AlphaGeometry 2

帖子 TheMatrix楼主 »

rtyu 写了: 2025年 2月 16日 00:02 据说 AlphaGeometry 的确会自己推理,还自己生成了一亿个几何图形来发现新的几何关系(定理). 好像和LLM不是一回事。如果AlphaGeometry成功了,人类可以向AI提供一些概念和方向,AI可以自己推导出定理,但不知道AI能不能知道哪些定理是有用的。

https://deepmind.google/discover/blog/a ... -geometry/
看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。
x2 图片

标签/Tags:
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 266
帖子: 13400
注册时间: 2022年 7月 26日 00:35

#2 Re: AlphaGeometry 2

帖子 TheMatrix楼主 »

头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 266
帖子: 13400
注册时间: 2022年 7月 26日 00:35

#3 Re: AlphaGeometry 2

帖子 TheMatrix楼主 »

TheMatrix 写了: 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。
这个模型分两部分,LLM和symbolic engine。

训练发生在LLM上,symbolic engine没有训练(神经网络意义的训练)。

LLM的作用主要是给symbolic engine提示画辅助线。一个提示不行再换一个提示。

这应该看成是在LLM指导下的一种工作方式。symbolic engine看成是工具。arxiv的paper我看了,似乎并没有强调这一点。不过deepmind网站的那篇和nature的那篇这一点还是清楚的。

LLM的训练数据是电脑生成的,也是用这个symbolic engine生成的好像,用以训练LLM以提出画辅助线的方法。

LLM还有一个作用是把问题从自然语言翻译成symbolic engine 接受的 formal语言。
上次由 TheMatrix 在 2025年 2月 16日 13:17 修改。
原因: 未提供修改原因
头像
TheMatrix楼主
论坛支柱
论坛支柱
2024年度优秀版主
TheMatrix 的博客
帖子互动: 266
帖子: 13400
注册时间: 2022年 7月 26日 00:35

#4 Re: AlphaGeometry 2

帖子 TheMatrix楼主 »

1.人工supervised learning --> 2.机器supervised learning --> 3.reinforcement learning

一个领域问题的解决大概就是这个路径。而1是突破口。

因为怎么准备supervised learning数据就是最大的问题,没有idea就没法准备。有了idea就算突破了。(当然,idea得有效果)。
上次由 TheMatrix 在 2025年 2月 16日 13:25 修改。
原因: 未提供修改原因
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 633
帖子: 26129
注册时间: 2022年 7月 24日 17:21

#5 Re: AlphaGeometry 2

帖子 Caravel »

TheMatrix 写了: 2025年 2月 16日 12:05 看了。很不错。

这个相当于LLM指导下的symbolic试探。

如果把LLM看成是主导的话,symbolic engine看成是工具,这个模型相当于把LLM和工具集成到了一体,也相当于是AI agent。

下一步的方向应该是进一步压缩symbolic engine的主动权。
国产版本也有了

国产AI几何模型性能达IMO金牌水平,打平谷歌DeepMind最新AlphaGeometry系列——

TongGeometry,使用的策略网络和价值网络还来自微调版本的DeepSeek-Coder。

它能解决IMO-AG-30题中的所有30题,在IMO-AG-50上也能解决42题,而人类金牌选手平均水平分别为:25.9、40.9。

TongGeometry不仅能解题还会出题,所出的题目甚至获得了权威数学竞赛认可。

就在去年全国高中数学联赛预赛北京地区的考试中,就有TongGeometry出的几何题;由美国IMO竞赛教练组组织的一项美国民间数学竞赛USEMO,也收录了TongGeometry出的两道几何题在他们的竞赛短表中。

TongGeometry由北京通用人工智能研究院打造,下文是更多细节。

+2.00 积分 [用户 TheMatrix 给您的打赏]
x2 图片
回复

回到 “STEM”