谷歌AI19秒答完IMO几何题,喜获银牌

对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。


版主: Softfist

回复
头像
lobster110(!)楼主
论坛元老
论坛元老
帖子互动: 643
帖子: 16683
注册时间: 2022年 7月 23日 20:36

#1 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 lobster110(!)楼主 »

数学界迎来AlphaGo时刻


近日,谷歌 DeepMind 宣布其人工智能系统在数学解题能力上取得了突破性进展。

在 2024 年国际数学奥林匹克竞赛(IMO,International Mathematical Olympiad)的六道题目中,该公司的人工智能系统成功解决了其中的四道,获得了相当于银牌的成绩。

这标志着人工智能系统首次在这项全球顶级少年数学家竞赛中达到了奖牌级别的表现。

DeepMind 开发了两个专门的人工智能系统 AlphaProof 和 AlphaGeometry 2,两者协作拿到了这一成绩。


AlphaProof 解决了两道代数题和一道数论题,其中包括本次比赛中最难的一道题目。而 AlphaGeometry 2 则成功解决了一道几何题,仅仅耗时 19 秒。未能完成的两道题属于组合数学的范畴。


这两个人工智能系统的总成绩获得了 42 分中的 28 分,仅差 1 分就达到了金牌的门槛。


IMO 作为自 1959 年以来每年举办的重大数学赛事,一直吸引着全球精英学生参与。

比赛涵盖代数、组合数学、几何和数论等领域,题目难度极高。近年来,IMO 问题的解决能力已成为评估人工智能系统数学推理能力的重要基准。

据 DeepMind 介绍,AlphaProof 是一个基于强化学习的系统,它通过生成和验证数百万个证明来自我训练,逐步解决越来越困难的问题。该系统使用形式化语言 Lean 来证明数学陈述。

训练数据不足是常见的问题之一,为解决该问题,研究团队设计了一个额外的网络,试图将现有的百万个用自然语言写成的问题翻译成 Lean 语言,而不包含人工编写的答案。


AlphaGeometry 2 是谷歌之前几何解题人工智能模型的升级版本,现在由基于 Gemini 的语言模型驱动。它可以解决与物体运动以及涉及角度、比率和距离的方程式有关的问题。


由于它比其前身接受了更多合成数据的训练,因此能够解决更具挑战性的几何问题。

在尝试本次 IMO 之前,AlphaGeometry 2 能够解决过去 25 年 IMO 几何问题的 83%,远高于其前身 53% 的成功率。

在今年的比赛中,该系统在接收到几何题的形式化版本后仅用 19 秒就找到了解决方法。

值得注意的是,人工智能系统解题的过程与人类参赛者有所不同。谷歌首先将 IMO 问题翻译成形式化的数学语言,然后交由人工智能模型处理。

而在正式比赛中,人类参赛者需要在两个 4.5 小时的环节中直接面对数学陈述。


尽管取得了令人瞩目的成就,但这项技术仍存在一些局限性。菲尔兹奖得主、著名数学家蒂莫西·高尔斯爵士(Timothy Gowers)指出了几个关键的限制因素。

首先,人工智能系统需要比人类参赛者更长的时间来解题,有些问题花费了 60 小时以上,而且人工智能系统的处理速度也比人类大脑快得多。如果给予人类参赛者同样的时间,他们的分数可能会更高。

其次,数学题需要人工将其翻译成形式化语言 Lean,然后人工智能模型才能开始工作。

虽然人工智能执行了最重要的数学推理,但这个“自动形式化”步骤仍需由人类完成。

此外,目前尚不清楚这种技术是否能扩展到其他数学领域,特别是那些训练数据较少的领域。

值得注意的是,人工智能系统未能解决两道组合数学问题,这表明它在某些数学领域还有待进步。

尽管存在这些限制,但专家们认为这项技术仍有巨大的潜力。高尔斯推测,这样的人工智能系统可能成为有价值的研究工具,能够帮助数学家回答广泛的问题,只要这些问题不太困难。这将极大地推动数学研究的发展。

剑桥大学专门研究数学和人工智能的研究员凯蒂·柯林斯(Katie Collins)指出,能够解决复杂数学问题的人工智能系统可能为“人类+人工智能”的协作模式开辟新的道路,帮助数学家解决和发明新类型的问题。

这反过来也可能帮助我们更好地理解人类是如何解决数学问题的。

谷歌 DeepMind 研究副总裁普什米特·科利表示,这是机器学习和人工智能领域的重大进展,迄今为止,还没有哪个系统能以这样的成功率和通用性来解决问题。

此外,作为 IMO 工作的一部分,DeepMind 还试验了一种基于谷歌 Gemini 和 DeepMind 最新研究的自然语言推理系统,以实现高级问题解决技能。

有了该系统后,不仅不用把问题翻译为形式语言,而且它还能够和其他人工智能系统结合使用。DeepMind 还在今年的 IMO 问题上测试了这种方法,结果显示出巨大的潜力。

“我们的团队正在继续探索多种用于推进数学推理的人工智能方法,并计划很快发布有关 AlphaProof 的更多技术细节。”DeepMind 在博客中写道。

可以预见的是,随着技术的不断进步,我们将会看到更多令人兴奋的人类+人工智能协作,推动数学和人工智能领域的共同发展。
萬水千山總是情
头像
lobster110(!)楼主
论坛元老
论坛元老
帖子互动: 643
帖子: 16683
注册时间: 2022年 7月 23日 20:36

#2 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 lobster110(!)楼主 »

“DeepMind 开发了两个专门的人工智能系统 AlphaProof 和 AlphaGeometry 2,两者协作拿到了这一成绩。”

这是作弊,相当于两个人合作答题。
萬水千山總是情
Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 677
帖子: 26970
注册时间: 2022年 7月 24日 17:21

#3 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 Caravel »

lobster110 写了: 2024年 7月 26日 13:12 “DeepMind 开发了两个专门的人工智能系统 AlphaProof 和 AlphaGeometry 2,两者协作拿到了这一成绩。”

这是作弊,相当于两个人合作答题。
这相当于专门的系统,和吴文俊的定理证明差别在哪里?
FGH
论坛精英
论坛精英
帖子互动: 106
帖子: 7033
注册时间: 2022年 7月 25日 16:30

#4 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 FGH »

能否攻克哥德巴赫猜想?或者孪生素数猜想?
FGH
论坛精英
论坛精英
帖子互动: 106
帖子: 7033
注册时间: 2022年 7月 25日 16:30

#5 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 FGH »

Caravel 写了: 2024年 7月 26日 13:17 这相当于专门的系统,和吴文俊的定理证明差别在哪里?
时代发展了,不能停留在吴文俊的阶段了。
头像
omicron
论坛点评
论坛点评
帖子互动: 103
帖子: 3260
注册时间: 2022年 7月 26日 16:25

#6 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 omicron »

看不懂题目是啥意思,还需要先被翻译成电脑理解的数学语言
Fnhdx
论坛点评
论坛点评
帖子互动: 165
帖子: 2463
注册时间: 2022年 8月 31日 21:40

#7 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 Fnhdx »

能解决世纪难题9.9和9.11谁大吗?
Yesterday
论坛支柱
论坛支柱
帖子互动: 1307
帖子: 12013
注册时间: 2022年 7月 31日 01:18

#8 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 Yesterday »

Fnhdx 写了: 2024年 7月 26日 13:32 能解决世纪难题9.9和9.11谁大吗?
9.9大,太简单啦,世纪难题已经解决了
头像
huangchong(净坛使者)
论坛元老
论坛元老
2023-24年度优秀版主
帖子互动: 4076
帖子: 60751
注册时间: 2022年 7月 22日 01:22

#9 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 huangchong(净坛使者) »

Fnhdx 写了: 2024年 7月 26日 13:32 能解决世纪难题9.9和9.11谁大吗?
我在YouTube上看到不少人会如读nine point nine 和nine point eleven,就奇怪 ,他们小学数学都怎么教的,那9.1101他得怎么读呢
zyyj2021(真有远见)
见习点评
见习点评
帖子互动: 209
帖子: 1984
注册时间: 2023年 6月 6日 12:37

#10 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 zyyj2021(真有远见) »

把柯洁干得怀疑人生了,

把颜宁干得辞职了,

又要让数学家失业了?!
上次由 zyyj2021 在 2024年 7月 26日 14:05 修改。
lahei(专用)
论坛元老
论坛元老
帖子互动: 1011
帖子: 27709
注册时间: 2022年 7月 28日 16:49

#11 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 lahei(专用) »

huangchong 写了: 2024年 7月 26日 13:56 我在YouTube上看到不少人会如读nine point nine 和nine point eleven,就奇怪 ,他们小学数学都怎么教的,那9.1101他得怎么读呢
隔二分段
Fnhdx
论坛点评
论坛点评
帖子互动: 165
帖子: 2463
注册时间: 2022年 8月 31日 21:40

#12 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 Fnhdx »

英语好像就两位两位这么读。比如2024就是twenty twenty four。
huangchong 写了: 2024年 7月 26日 13:56 我在YouTube上看到不少人会如读nine point nine 和nine point eleven,就奇怪 ,他们小学数学都怎么教的,那9.1101他得怎么读呢
da1gaku
论坛元老
论坛元老
帖子互动: 395
帖子: 18915
注册时间: 2022年 7月 23日 23:35

#13 Re: 谷歌AI19秒答完IMO几何题,喜获银牌

帖子 da1gaku »

Fnhdx 写了: 2024年 7月 26日 14:05 英语好像就两位两位这么读。比如2024就是twenty twenty four。
250也可以说成two fifty
跟以前课本上的不一样
回复

回到 “军事天地(Military)”