563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。


版主: Softfist

回复
头像
foofy(自带干粮五毛)楼主
论坛元老
论坛元老
帖子互动: 491
帖子: 16974
注册时间: 2022年 8月 10日 01:38

#1 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 foofy(自带干粮五毛)楼主 »

https://m.mydrivers.com/newsview/986036.html
563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34
黑白2024年06月16日 13:031

快科技6月16日消息,在最近举办的阿里巴巴全球数学竞赛中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。

不仅如此,今年的阿里数赛还首次开放了AI大模型挑战赛,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。

最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。

AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行“自问自答自验证”的方法,以寻求问题的最优解。

而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。

尽管AI在数学竞赛中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。

AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。
sgisp2
著名点评
著名点评
帖子互动: 119
帖子: 4585
注册时间: 2022年 7月 25日 01:12

#2 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 sgisp2 »

AI现在的推理模式决定了这不是真智能,只是算力
x1 图片
Whyisthis(为什么会这样)
职业作家
职业作家
帖子互动: 57
帖子: 487
注册时间: 2022年 11月 17日 16:22

#3 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 Whyisthis(为什么会这样) »

foofy 写了: 2024年 6月 16日 01:46 https://m.mydrivers.com/newsview/986036.html
563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34
黑白2024年06月16日 13:031

快科技6月16日消息,在最近举办的阿里巴巴全球数学竞赛中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。

不仅如此,今年的阿里数赛还首次开放了AI大模型挑战赛,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。

最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。

AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行“自问自答自验证”的方法,以寻求问题的最优解。

而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。

尽管AI在数学竞赛中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。

AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。
AI没有逻辑推理,只有统计,从所有组合中找出一个最像的答案。
x1 图片
alps5241
论坛精英
论坛精英
帖子互动: 482
帖子: 6564
注册时间: 2023年 12月 11日 23:45

#4 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 alps5241 »

Whyisthis 写了: 2024年 6月 16日 06:22 AI没有逻辑推理,只有统计,从所有组合中找出一个 **最像** 的答案。
Yes
Whyisthis(为什么会这样)
职业作家
职业作家
帖子互动: 57
帖子: 487
注册时间: 2022年 11月 17日 16:22

#5 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 Whyisthis(为什么会这样) »

alps5241 写了: 2024年 6月 16日 06:32Yes
由于组合很多,所以需要的算力也很庞大。组合越多,需要的算力就越庞大,但数学的组合是无限的,所以现有的人工智能从原理上就不适用于数学。
xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 1079
帖子: 26120
注册时间: 2023年 9月 5日 20:18

#6 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 xiaoju(可爱的龙猫) »

阿里用的语言太别扭,误导AI使其认为这不是数学题
foofy 写了: 2024年 6月 16日 01:46 https://m.mydrivers.com/newsview/986036.html
563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34
黑白2024年06月16日 13:031

快科技6月16日消息,在最近举办的阿里巴巴全球数学竞赛中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。

不仅如此,今年的阿里数赛还首次开放了AI大模型挑战赛,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。

最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。

AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行“自问自答自验证”的方法,以寻求问题的最优解。

而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。

尽管AI在数学竞赛中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。

AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。
zheliemit(繁体中文)
论坛点评
论坛点评
帖子互动: 176
帖子: 2376
注册时间: 2022年 11月 16日 00:03

#7 Re: 563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

帖子 zheliemit(繁体中文) »

Whyisthis 写了: 2024年 6月 16日 06:22 AI没有逻辑推理,只有统计,从所有组合中找出一个最像的答案。
你们这都是落伍到什么地方了,llm可以推理,不是统计,统计是机器学习。
ai早晚能做复杂的推理,不信打个赌,阿里的数据竞赛顶多再开三年就被ai超过
回复

回到 “军事天地(Military)”