![]() |
|
大模型王位,再次易主。
数小时前,马斯克旗下人工智能公司xAI放出最新模型Grok 4.1,主打“智商情商双在线”,正面硬刚GPT-5.1。
据xAI介绍,本次Grok 4.1共有两个版本:Grok 4.1 Thinking(推理)和Grok 4.1(非推理)。目前,Grok 4.1已向全网用户开放,可在Grok官网、X平台以及iOS和Android应用中免费体验。
值得一提的是,Grok 4.1的情商进步明显,具备了更高的理解力、洞察力、同理心和人际交往能力。
在情商测试EQ-Bench3中,Grok 4.1 Thinking以1586分的成绩同样霸榜,Grok 4.1位居第二,排名第三的是国产模型Kimi K2。
从实测效果看,对比上一代Grok模型,Grok 4.1变成了一位更具耐心的倾听者,且共情能力凸显。细节的是,还在回复结尾位置比了个心。


此外,Grok 4.1的创意写作能力较上一代足足提升了600分,语言表达流畅有画面感。而且,基于训练方法的优化,模型幻觉率比之前降低了3倍(从12.09%降至4.22%)。

据介绍,为实现上述提升,xAI在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征。并且,xAI开发了全新方法,能够利用前沿智能体式推理模型作为奖励模型,从而实现大规模自主评估和迭代响应。
xAI负责后训练的Dustin Tran分享了更多细节,他表示,新模型的改进主要在强化学习上,将RLHF推向了前所未有的新高度。
“在过去的几个月里,我们由十几个人组成的团队利用用户在真实对话中的偏好,以及基于强大推力能力进行评分的智能体奖励模型,对强化学习的算法进行了全面改进。此外,我们还将强化学习的规模扩大10倍。”
作为AI赛道的后起之秀,xAI能取得今天的成绩与老马的人才战略也密不可分。最近xAI的团队合影在社交平台疯传:满屏望去清一色黑头发黄皮肤的华人面孔。另有消息称马斯克已经辞退了Grok团队的最后一名白人成员,硬是把团队打造成了“全华班”。

比起Grok 4.1,很多人更好奇为何宣传已久的Grok 5迟迟不来?
有报道称,“xAI 推迟发布Grok 5,部分原因在于开发过程中遇到的资源限制和极其严格的测试需求。”
马斯克在近日最新访谈中回应,“作为迈向通用人工智能(AGI)的关键一步,Grok 5预计拥有约6万亿参数,其训练和优化需要巨大的计算能力,并将成为世界上最智能的人工智能。因此,Grok 5的全面测试和开发工作需要更多时间才能达到预期的高标准,将在明年发布。”
整体来看,本次Grok 4.1的发布不仅是技术迭代,也是马斯克AI战略的强力宣言,为 Grok 5和最终实现AGI目标铺设道路。但也有业内人士认为,“它仍可能不是今年最好的模型型号,等着看谷歌即将发布的Gemini 3.0模型表现。”
| 当前新闻共有0条评论 | 分享到: |
|
||||||||||
| 评论前需要先 登录 或者 注册 哦 |
||||||||||||
| 24小时新闻排行榜 | 更多>> |
| 1 | 暴跌!中国经济突传重磅信号 |
| 2 | 北京高层疯传:习近平又添新绰号! |
| 3 | 中国多地告急 万亿级大雷即将引爆 |
| 4 | 胡春华出席座谈会 报道再现异常 |
| 5 | 北京不敢提:习近平遭她羞辱,引雷霆之怒 |
| 48小时新闻排行榜 | 更多>> |
| 1 | 经营22年航空公司突然倒闭 全部航班一夜取 |
| 2 | 暴跌!中国经济突传重磅信号 |
| 3 | 北京高层疯传:习近平又添新绰号! |
| 4 | 中国多地告急 万亿级大雷即将引爆 |
| 5 | 放弃年薪百万嫁到英国 我现在只想回国 |
| 6 | 胡春华出席座谈会 报道再现异常 |
| 7 | 曾经的储君胡春华 被习近平踢出核心权力圈 |
| 8 | 北京不敢提:习近平遭她羞辱,引雷霆之怒 |
| 9 | 北京突然跨出很危险的一步 |
| 10 | 重大决裂!川普:不再支持 |
| 一周博客排行 | 更多>> |
| 1 | 西安官场大塌方,一夜上百官员 | 雷歌747 |
| 2 | 狗屁 | 丁小明 |
| 3 | 中央下死命令逼李井泉必须往外 | 高伐林 |
| 4 | 红色后代无耻到了极点 | 周汉卿 |
| 5 | 回国杂感:有一种旅游叫中国旅 | 思芦 |
| 6 | 中共“红旗”倒了! | 山蛟龙 |
| 7 | 悼老哥 忆几位浙江大学老姐 | 体育老师 |
| 8 | 一件小事——见证纽约华人餐馆 | 溪边树下 |
| 9 | 中亚全线倒向美国,中共的一带 | 山蛟龙 |
| 10 | 王沪宁同志文摘:请认真学习 | 阿妞不牛 |
| 一周博文回复排行榜 | 更多>> |