此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek的大模型在推理方面取得重大突破
Putnam bench得了49分,现有大模型都在10分之下
Gemini2.5只有3分,o3mini 0分
(转载)deepseek的大模型在推理方面取得重大突破
版主: verdelite, TheMatrix
-
- 论坛元老
Caravel 的博客 - 帖子互动: 491
- 帖子: 23018
- 注册时间: 2022年 7月 24日 17:21
#2 Re: (转载)deepseek的大模型在推理方面取得重大突破
还是得弄清其底层机制。老弄个什么bench做测试,不说完全无效,至少还是让人不能信服。Caravel 写了: 2025年 4月 30日 13:45 此帖转自 Caravel 在 军事天地(Military) 的帖子:deepseek的大模型在推理方面取得重大突破
Putnam bench得了49分,现有大模型都在10分之下
Gemini2.5只有3分,o3mini 0分