追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

对应老买买提的军事天地,观点交锋比较激烈,反驳不留情面,请作好心理准备。因为此版帖子太多,所以新帖不出现在首页新帖列表,防止首页新帖刷屏太快。


版主: Softfist

回复
goodegg(我是大陆人)楼主
知名作家
知名作家
帖子互动: 195
帖子: 919
注册时间: 2023年 7月 23日 03:31

#1 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 goodegg(我是大陆人)楼主 »

大模型竞技场LMArena日前更新的排名显示,智谱上月底发布的最新旗舰模型GLM-4.6综合排名位列第4,与阿里旗下的Qwen3-Max-Preview持平,并列国内第一,也是全球开源模型第一。

GLM-4.6发布于9月30日,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。

智谱提供的信息显示,在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。

在LMArena最新排名中,GLM-4.6的创造性写作能力也成功登上了全球第一。

凭借良好的能力表现,GLM-4.6目前也在Hugging Face Trending和全球⼤模型API超市OpenRouter趋势榜双双登顶。

另外值得一提的是,阿里通义Qwen3-Max的正式版本0923,却未能在LMArena的测试中超越Preview版本,仅仅排在第9位。但其数学能力也能够排名全球第一。

9月份以来,国产大模型迎来密集更新,包括GLM-4.6、Qwen3-Max和Kimi K2等均有出色的跑分表现。

头像
fanqie
论坛元老
论坛元老
帖子互动: 1116
帖子: 16713
注册时间: 2023年 2月 22日 13:23

#2 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 fanqie »

全是中国的

头像
pseudo(small man)
论坛点评
论坛点评
pseudo 的博客
帖子互动: 151
帖子: 2726
注册时间: 2022年 7月 28日 10:04

#3 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 pseudo(small man) »

goodegg 写了: 2025年 10月 8日 22:25

大模型竞技场LMArena日前更新的排名显示,智谱上月底发布的最新旗舰模型GLM-4.6综合排名位列第4,与阿里旗下的Qwen3-Max-Preview持平,并列国内第一,也是全球开源模型第一。

GLM-4.6发布于9月30日,在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。

智谱提供的信息显示,在公开基准与真实编程任务中,GLM-4.6的代码能力对齐Claude Sonnet 4,是国内已知的最好的Coding模型。

在LMArena最新排名中,GLM-4.6的创造性写作能力也成功登上了全球第一。

凭借良好的能力表现,GLM-4.6目前也在Hugging Face Trending和全球⼤模型API超市OpenRouter趋势榜双双登顶。

另外值得一提的是,阿里通义Qwen3-Max的正式版本0923,却未能在LMArena的测试中超越Preview版本,仅仅排在第9位。但其数学能力也能够排名全球第一。

9月份以来,国产大模型迎来密集更新,包括GLM-4.6、Qwen3-Max和Kimi K2等均有出色的跑分表现。

将军们有用过qwen-code的吗,感觉怎么样?

头像
foofy(自带干粮五毛)
论坛元老
论坛元老
帖子互动: 514
帖子: 17370
注册时间: 2022年 8月 10日 01:38

#4 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 foofy(自带干粮五毛) »

牛逼

goodegg(我是大陆人)楼主
知名作家
知名作家
帖子互动: 195
帖子: 919
注册时间: 2023年 7月 23日 03:31

#5 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 goodegg(我是大陆人)楼主 »

已试用,coding 感觉很牛逼,超出预期
可以用作 Claude的 Sonnet 4.1 平替
价格比 Claude 便宜很多。

foofy 写了: 2025年 10月 8日 22:38

牛逼

头像
foofy(自带干粮五毛)
论坛元老
论坛元老
帖子互动: 514
帖子: 17370
注册时间: 2022年 8月 10日 01:38

#6 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 foofy(自带干粮五毛) »

goodegg 写了: 2025年 10月 9日 05:28

已试用,coding 感觉很牛逼,超出预期
可以用作 Claude的 Sonnet 4.1 平替
价格比 Claude 便宜很多。

哪个?阿里还是知普?

xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 1105
帖子: 26454
注册时间: 2023年 9月 5日 20:18

#7 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 xiaoju(可爱的龙猫) »

美国在这个领域已经放弃治疗了

fanqie 写了: 2025年 10月 8日 22:26

全是中国的

Caravel
论坛元老
论坛元老
Caravel 的博客
帖子互动: 691
帖子: 27244
注册时间: 2022年 7月 24日 17:21

#8 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 Caravel »

xiaoju 写了: 2025年 10月 9日 06:11

美国在这个领域已经放弃治疗了

deepseek鼎盛期名列竞技场并列第一

现在又被私有模型打回去一点

goodegg(我是大陆人)楼主
知名作家
知名作家
帖子互动: 195
帖子: 919
注册时间: 2023年 7月 23日 03:31

#9 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 goodegg(我是大陆人)楼主 »

GLM 4.6

foofy 写了: 2025年 10月 9日 05:51

哪个?阿里还是知普?

xiaoju(可爱的龙猫)
论坛元老
论坛元老
帖子互动: 1105
帖子: 26454
注册时间: 2023年 9月 5日 20:18

#10 Re: 追平Qwen3,智谱GLM-4.6登顶全球开源模型第一

帖子 xiaoju(可爱的龙猫) »

时代变了,现在的研究热点是reasoner和低成本token

哪怕多花几亿砸出来个分更高的gpt6,也只是靠作弊拿的分,改变不了数学原理的能力上限

Caravel 写了: 2025年 10月 9日 06:15

deepseek鼎盛期名列竞技场并列第一

现在又被私有模型打回去一点

回复

回到 “军事天地(Military)”