阿里千问最强模型重磅亮相多项性能破全球纪录

www.creaders.net | 2026-01-26 08:38:48 潮新闻 | 0条评论 | 查看/发表评论

1月26日，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking，创下数项权威评测全球新纪录，性能媲美GPT-5.2、Gemini 3 Pro，成为迄今为止最接近国际顶尖模型的国内最强AI大模型。通过总参数、强化学习、推理计算的极致规模扩展，千问新模型实现了性能的大幅飞跃，刷新科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）、代码编程（LiveCodeBench）等多项关键性能基准测试的全球纪录。

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型，其总参数量超万亿（1T），预训练数据量高达36T Tokens。此前，预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分，推理性能已让人惊艳；在此基础上，阿里通义团队进行了更大规模的强化学习后训练，全面提升了正式版Qwen3-Max-Thinking性能：在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中，千问旗舰推理模型刷新了数项最佳表现（SOTA）纪录，整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5 和 Gemini 3 Pro 。

在关键的模型推理能力提升中，千问新模型采用了一种全新的测试时扩展（Test-time Scaling）机制，推理性能提升的同时还更经济。业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论，造成冗余推理效率低下；而千问采用的这一新机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算，获得更智能的推理结果。基于这一推理技术创新，千问推理性能和推理效率大为提升，比如在启用工具的“人类最后的测试”HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8，录得当前所有模型的最高分。

面向即将到来的智能体Agent时代，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。具体而言，在完成初步的工具使用微调后，通义团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练，使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。这种自适应的工具调用能力可在QwenChat上完整体验，模型自主选用搜索、个性化记忆和代码解释器等三个核心的Agent工具功能，提供专业人士一样水平的回答，更合用户心意、更智能、更流畅；同时，模型幻觉也大为降低，为解决真实复杂任务打下基础。

目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。据了解，千问APP也即将接入新模型，所有用户都可免费体验千问最强模型。

阿里千问最强模型重磅亮相多项性能破全球纪录

阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking（受访者供图）

相关新闻

留不住！Meta“2亿美元”AI大将被挖走	黄仁勋喊话：“市场搞错了”
一篇有关AI的“假想”报告吓崩华尔街股价大跌	中网友曝被AI飙骂“你妈个B” 腾讯急了
Google超实用AI笔记4核心功能一次学会	Anthropic控中国大模型使诈马斯克凶猛炮轰
开工如有神助，10款AI利器登场	后果不堪设想 AI巨头重磅控中国工业级盗取
两大恐怖预言，一篇AI末日论文章疯传	发现中国数百AI账号暗中插手日本大选
我复旦毕业用AI鉴定玉石 8个月收入上百万	习赤膊上阵中国释放不同寻常经济信号
春节AI模型大战谁是最大赢家	中国AI短剧全面爆发揭秘背后的生产流程
阵仗这么大，但中国去哪了？	全球首个中国研发出能诊断罕见病的AI医生
股神巴菲特的最后一舞为何重金拥抱纽约时报	BBC: 这款中国AI模型令好莱坞陷入恐慌
千亿美元承诺剩300亿投资OpenAI 黄仁勋缩手	春节AI红包大战网企巨头豪掷45亿人民币

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

更多>>

1	节后第一天习突然开刀生死战全面爆发
2	癌症源头已发现？咸菜没上榜，第1大家天天
3	全国人大一号公报未提张又侠释放什么信号
4	身陷爱泼斯坦案丑闻前首相自杀未遂情况危
5	“习近平被抓”谣言四起！专家：纸包不住火

48小时新闻排行榜

更多>>

1	谷爱凌摊上大事了！
2	预言正在应验习的危害到底有多大？
3	节后第一天习突然开刀生死战全面爆发
4	党媒年后第一天戳习崔永元突然现身
5	大毒枭“门乔”春宵一夜后被击毙情妇照片
6	美最新民调：民众对川普的看法正在改变...
7	中办《通知》来势汹汹人大、政协代表恐慌
8	癌症源头已发现？咸菜没上榜，第1大家天天
9	习呼吸沉重这两字致命
10	参加CIA中国机密简报会后库克吓到睡不好

热门专题

1 张又侠	6 万维专栏	11 何卫东
2 川普	7 委内瑞拉	12 AI
3 俄乌战争	8 四中全会	13 中共两会
4 中美冷战	9 美伊冲突	14 大S
5 中日关系	10 以伊战争	15 洛杉矶大火

一周博客排行

更多>>

1	《忠诚的无言》第二部【有岸	麒麟儿
2	【美花滑冠军 Alysa Liu 刘美	歌哥
3	世界冠军的奇葩老留父亲	怡光
4	彭丽媛一碗汤药可救全民于水火	明豪
5	海外华人热门政治话题：都是异	随意生活
6	电大同学聚会，巴山老狼遭遇大	横断万重山
7	冬奥结束说爱凌	山蛟龙
8	今天最高法院判决川普关税违宪	马黑
9	如果邓小平健在，他是否会再来	陈家梁子
10	“反华”为何还要过春节？	文庙

一周博文回复排行榜

更多>>

1	最高法院裁定：川普两类关税，	must
2	老钱：人渣谷爱金	老钱
3	法制的赞歌	0+1
4	海外华人热门政治话题：都是异	随意生活
5	公益贴 ---- 谈谈川普的关税	木桩
6	川普为何不能完全退出联合国和	阿妞不牛
7	第一美女：刘美贤谷爱凌是童年	YOLO宥乐
8	为何被黄川粉狂捧的Alysa Liu,	爪四哥
9	周末段子：一图胜过千言万语	爪四哥
10	过年的重要节日「人日节」	voigt


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.

阿里千问最强模型重磅亮相 多项性能破全球纪录

阿里千问最强模型重磅亮相多项性能破全球纪录