![]() |
|
据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
近期,科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力而设计。
实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的长文本生成任务时,仍暴露出显著的改进需求。
以GPT-4o为例,在要求其生成详细旅行规划的任务中,即便提供了明确的时间节点和直飞航班信息,模型的输出结果中仍出现了不存在的航班信息,即产生了“幻觉”现象。
实验进一步揭示,即便是最前沿的模型,在生成连贯且冗长的内容方面仍存在较大提升空间。特别是在需要输出8k tokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型(LLM)研究的一个极具潜力的方向。
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 惊传:外交部官员携密件叛逃俄罗斯 倒逼王 |
2 | 马斯克,突爆大消息! |
3 | 不要看走眼,他才是结束习的“狠角色” |
4 | 刚刚,见证历史!近10万人爆仓 |
5 | 上海深圳爆倒闭潮 失业大军现街头 |
48小时新闻排行榜 | 更多>> |
一周博客排行 | 更多>> |
1 | 汪洋接总书记 张又侠不答应 | 胡亥 |
2 | 包子学歇业公告 | 阿妞不牛 |
3 | 当年举报毕福剑的张清遭天谴 | 体育老师 |
4 | 张大帅治国与党指挥枪 | 文庙 |
5 | 709 与 404 | 谢盛友文集 |
6 | 2024回国:华东行-黄山杭州 | 马黑 |
7 | 不低头的硬汉! 怀念北京大学 | 甲申秋立 |
8 | Wow,今天MRNA疫苗股一枝独秀 | 体育老师 |
9 | 榨干了最后一块铜板,够狠够缺 | 席琳 |
10 | 埃及成为了中共国新的洗厂地热 | 山蛟龙 |
一周博文回复排行榜 | 更多>> |
1 | MAGA主旋律.对等关税很正常.美 | 木秀于林 |
2 | 同志—称谓残简 | 阿妞不牛 |
3 | 两岸统一将会是一场腥风血雨的 | 山货郎 |
4 | 包子学歇业公告 | 阿妞不牛 |
5 | Wow,今天MRNA疫苗股一枝独秀 | 体育老师 |
6 | 俄乌战争:阿川第三张牛皮又吹 | 随意生活 |
7 | 说一下阎润涛 | 席琳 |
8 | 汪洋接总书记 张又侠不答应 | 胡亥 |
9 | 张大帅治国与党指挥枪 | 文庙 |
10 | 当年举报毕福剑的张清遭天谴 | 体育老师 |