万维读者网 > 数码科技 > 正文

OpenAI调查：GPT-4o及4o-mini模型性能下降

www.creaders.net | 2025-01-20 13:01:23 快科技 | 0条评论 | 查看/发表评论

据报道，OpenAI发布事故报告指出，当前遭遇GPT-4o和4o-mini模型性能下降问题，目前正在进行调查，并将尽快发布最新消息。

近期，科研人员创新性地推出了一项名为LONGPROC的基准测试工具，该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。

实验结果略显意外：包括GPT-4o在内的众多顶尖模型，虽然在常规长上下文回忆基准测试中表现优异，但在应对复杂的长文本生成任务时，仍暴露出显著的改进需求。

具体而言，尽管所有参测模型均宣称其上下文窗口大小超过32K tokens，但实际情况却大相径庭。开源模型在处理仅含2K tokens的任务时便显露疲态，而诸如GPT-4o等闭源模型，在应对8K tokens任务时性能也明显下滑。

以GPT-4o为例，在要求其生成详细旅行规划的任务中，即便提供了明确的时间节点和直飞航班信息，模型的输出结果中仍出现了不存在的航班信息，即产生了“幻觉”现象。

实验进一步揭示，即便是最前沿的模型，在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需要输出8k tokens的任务中，即便是参数庞大的先进模型也未能幸免于难，这或许预示着未来大型语言模型（LLM）研究的一个极具潜力的方向。

0

相关新闻

特斯拉车主横跨整个美国全程没碰方向盘	2026年的AI，真的要“抢饭碗”了
人工智能真的能帮人们找到爱情吗？	可怕！美专家警告：AI误判恐在几分钟内引爆核战
华尔街分析师：2026年最看好的5支AI概念股	辉达携手台积电冲刺中企200万颗H200大单
14亿年薪还不够美巨头再砸140亿收购华人AI公司	中国AI机器人“造反”视频疯传
豪掷20亿：Meta收购Manus，肖弘出任副总裁	软银卖光英伟达持股含泪完成对OpenAI承诺
60后到00后，我家两代4位程序员戳中的残酷真相	最强7大AI工具排行榜出炉最大黑马杀出
他杀死83岁母亲！AI的温柔正在杀人	硅谷一线峰会，这一幕令大佬们清醒
长期与AI聊天，会诱发这种精神病	YouTube推荐影片1/5竟是“AI废片”
174名北大学生能否考过AI？结果很意外	人类正走进高度不确定未来 AI教父最深层恐惧
暴跌27.5%！美国码农，正被“大屠杀”	北大老师专为AI设计的期中考试结果出乎意料

“人工智能AI”

当前新闻共有0条评论

分享到：

评论前需要先登录或者注册哦

全部评论

暂无评论上一页下一页

实用资讯

抗癌明星组合多年口碑保证！天然植物萃取有效对抗癌细胞
中老年补钙必备，2星期消除夜间抽筋、腰背疼痛，防治骨质疏松立竿见影

24小时新闻排行榜

1	逆潮流而动，顶尖科学家从中国归国
2	习遭降维打击，新华社通稿4个细节惊心动魄
3	中共官场突然敢骂习了，谁给的胆子？
4	比美国还狂？2026第一天，新加坡发文告诫中
5	中国跨年夜万人倒数惊现这一幕！网：太尴

48小时新闻排行榜

1	习家“储君”出事？皇侄齐明正突然消失
2	北京七环大爆炸，传老习两口子躲了整整两天
3	逆潮流而动，顶尖科学家从中国归国
4	习遭降维打击，新华社通稿4个细节惊心动魄
5	中共官场突然敢骂习了，谁给的胆子？
6	习走错“关键一步” 渐失话语权
7	比美国还狂？2026第一天，新加坡发文告诫中
8	跨年夜，中国多个大城市现诡异一幕
9	中国跨年夜万人倒数惊现这一幕！网：太尴
10	两岸开打让家人上战场？投票结果超震撼

热门专题

1 俄乌战争	6 四中全会	11 中共两会
2 中日关系	7 美伊冲突	12 大S
3 中美冷战	8 以伊战争	13 洛杉矶大火
4 万维专栏	9 何卫东	14 叙利亚
5 川普	10 AI	15 苗华被抓

一周博客排行

1	2026年1月1日A4白纸自由宣言	万维网友来
2	刷屏的美国“斩杀线”与中共的	解滨
3	回国杂感：仓颉造字成真，有图	思芦
4	梅兰芳和兩位仍然在世的入室弟	玉质
5	安芃：男人的出轨和女人的出轨	水沫
6	共军上将军头集体消失的秘密	胡亥
7	70%美国大学毕业生找不到工作	乐维
8	美国斩杀线：愚昧和麻木	汪翔
9	美国巨变：特朗普把三大最争议	文礼
10	三千年未有之新中国——一份关	万维网友来

一周博文回复排行榜

1	台湾问题：麻将停牌	随意生活
2	东亚战争准备：从暗杀安倍开始	随意生活
3	川普到底卖了乌克兰没有？	山蛟龙
4	梅兰芳和兩位仍然在世的入室弟	玉质
5	第一美女：《越人歌》-宋祖英	YOLO宥乐
6	做这道题，知道明年你要去哪？	末班车
7	关于离岸爱国	阿里克斯Y
8	海外中文出版的新路基本开通，	高伐林
9	70%美国大学毕业生找不到工作	乐维
10	三千年未有之新中国——一份关	万维网友来


关于本站 \| 广告服务 \| 联系我们 \| 招聘信息 \| 网站导航 \| 隐私保护
Copyright (C) 1998-2026. Creaders.NET. All Rights Reserved.