万维读者网 > 数码科技 > 正文  

Grok4.1发布 马斯克AI王牌 团队被传“全华班”

www.creaders.net | 2025-11-18 15:37:31  搜狐科技 | 0条评论 | 查看/发表评论

大模型王位,再次易主。

数小时前,马斯克旗下人工智能公司xAI放出最新模型Grok 4.1,主打“智商情商双在线”,正面硬刚GPT-5.1。

据xAI介绍,本次Grok 4.1共有两个版本:Grok 4.1 Thinking(推理)和Grok 4.1(非推理)。目前,Grok 4.1已向全网用户开放,可在Grok官网、X平台以及iOS和Android应用中免费体验。

从测试结果看,在公认大模型排名榜单LMArena中,Grok 4.1 Thinking以1483分的成绩一举加冕全球大模型之王,超越Gemini 2.5 Pro 31分。而非推理模式的Grok 4.1,也直接杀到榜单第二。

值得一提的是,Grok 4.1的情商进步明显,具备了更高的理解力、洞察力、同理心和人际交往能力。

在情商测试EQ-Bench3中,Grok 4.1 Thinking以1586分的成绩同样霸榜,Grok 4.1位居第二,排名第三的是国产模型Kimi K2。

从实测效果看,对比上一代Grok模型,Grok 4.1变成了一位更具耐心的倾听者,且共情能力凸显。细节的是,还在回复结尾位置比了个心。

Grok4.1发布 马斯克AI王牌 团队被传“全华班”

Grok4.1发布 马斯克AI王牌 团队被传“全华班”

此外,Grok 4.1的创意写作能力较上一代足足提升了600分,语言表达流畅有画面感。而且,基于训练方法的优化,模型幻觉率比之前降低了3倍(从12.09%降至4.22%)。

Grok4.1发布 马斯克AI王牌 团队被传“全华班”

据介绍,为实现上述提升,xAI在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征。并且,xAI开发了全新方法,能够利用前沿智能体式推理模型作为奖励模型,从而实现大规模自主评估和迭代响应。

xAI负责后训练的Dustin Tran分享了更多细节,他表示,新模型的改进主要在强化学习上,将RLHF推向了前所未有的新高度。

“在过去的几个月里,我们由十几个人组成的团队利用用户在真实对话中的偏好,以及基于强大推力能力进行评分的智能体奖励模型,对强化学习的算法进行了全面改进。此外,我们还将强化学习的规模扩大10倍。”

作为AI赛道的后起之秀,xAI能取得今天的成绩与老马的人才战略也密不可分。最近xAI的团队合影在社交平台疯传:满屏望去清一色黑头发黄皮肤的华人面孔。另有消息称马斯克已经辞退了Grok团队的最后一名白人成员,硬是把团队打造成了“全华班”。

Grok4.1发布 马斯克AI王牌 团队被传“全华班”

比起Grok 4.1,很多人更好奇为何宣传已久的Grok 5迟迟不来?

有报道称,“xAI 推迟发布Grok 5,部分原因在于开发过程中遇到的资源限制和极其严格的测试需求。”

马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok 5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。因此,Grok 5的全面测试和开发工作需要更多时间才能达到预期的高标准,将在明年发布。”

整体来看,本次Grok 4.1的发布不仅是技术迭代,也是马斯克AI战略的强力宣言,为 Grok 5和最终实现AGI目标铺设道路。但也有业内人士认为,“它仍可能不是今年最好的模型型号,等着看谷歌即将发布的Gemini 3.0模型表现。”

   0


热门专题
1
四中全会
6
美伊冲突
11
大S
2
中美冷战
7
以伊战争
12
洛杉矶大火
3
川普
8
何卫东
13
叙利亚
4
万维专栏
9
AI
14
苗华被抓
5
俄乌战争
10
中共两会
15
美国大选
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.