![]() |
|
Nature自然杂志发表文章称,中国研制的大型语言模型DeepSeek-R1令科学家们兴奋不已,它被认为是 OpenAI 的 o1 等推理模型的经济实惠且开放的竞争对手。
这些模型一步一步地生成响应,其过程类似于人类的推理。这使得它们比早期的语言模型更善于解决科学问题,也意味着它们可能在研究中有用。1 月 20 日发布的 R1 的初步测试表明,它在化学、数学和编码的某些任务上的表现与 o1 相当——后者在 9 月由 OpenAI 发布时让研究人员惊叹不已。
“这太疯狂了,完全出乎意料。”人工智能研究员、英国人工智能咨询公司 DAIR.AI 联合创始人埃尔维斯·萨拉维亚 (Elvis Saravia) 在 X 上写道。
德国埃尔朗根马克斯普朗克光科学研究所人工智能科学家实验室负责人马里奥·克伦 (Mario Krenn) 表示:DeepSeek 的开放性非常了不起。
相比之下,加州旧金山 OpenAI 建立的 o1 和其他模型(包括其最新成果 o3)本质上都是黑匣子,他说。
DeepSeek 尚未公布训练 R1 的全部成本,但其界面收费仅为 o1 运行成本的三十分之一。该公司还创建了 R1 的迷你精简版本,以允许计算能力有限的研究人员使用该模型。
“使用 o1 进行的实验成本超过 300 英镑 [370 美元],而使用 R1 的成本不到 10 美元。”Krenn 说。“这是一个巨大的差异,肯定会对其未来的采用产生影响。”
挑战模型
R1 是中文大型语言模型 (LLM) 热潮的一部分。DeepSeek 从一家对冲基金中分拆出来,上个月发布了一款名为 V3 的聊天机器人,一举成名。尽管预算极低,但这款机器人的表现却超越了主要竞争对手。专家估计,租用训练该模型所需的硬件成本约为 600 万美元,而 Meta 的 Llama 3.1 405B 则高达 6000 万美元,使用的计算资源是 V3 的 11 倍。
DeepSeek 的部分热门话题是,尽管美国出口管制限制中国公司获得为人工智能处理而设计的最佳计算机芯片,但它还是成功制造了 R1。华盛顿西雅图的人工智能研究员 François Chollet 说:R1 来自中国,这一事实表明,高效利用资源比单纯的计算规模更重要。
DeepSeek 的进展表明美国曾经的领先优势已经大幅缩小,华盛顿州贝尔维尤的技术专家 Alvin Wang Graylin 在 X 上写道,他在HTC 工作。“中美两国需要采取合作的方式来打造先进的人工智能,而不是继续目前这种没有胜算的军备竞赛方式。”
思路
LLM 训练数十亿个文本样本,将它们剪切成单词部分(称为标记),并学习数据中的模式。这些关联允许模型预测句子中的后续标记。但 LLM 容易捏造事实,这种现象称为幻觉,并且经常难以推理问题。
与 o1 一样,R1 使用思路链方法来提高 LLM 解决更复杂任务的能力,包括有时回溯和评估其方法。DeepSeek 通过使用强化学习对 V3 进行微调来制作 R1,强化学习会奖励模型得出正确答案并以概述其思维的方式解决问题。
英国爱丁堡大学人工智能研究员 Wenda Li 表示,计算能力有限促使该公司在算法上进行创新。在强化学习过程中,该团队估算了模型在每个阶段的进度,而不是使用单独的网络对其进行评估。
英国剑桥大学计算机科学家 Mateja Jamnik 表示,这有助于降低培训和运行成本。研究人员还使用了混合专家架构,该架构允许模型仅激活与每项任务相关的部分。
在基准测试中, DeepSeek-R1 在加州大学伯克利分校研究人员编写的数学问题 MATH-500 中取得了 97.3% 的成绩,并在一项名为 Codeforces 的编程竞赛中击败了 96.3% 的人类参与者。这些能力与 o1 不相上下;o3 未被纳入比较范围(参见“AI 竞争对手”)。
很难判断基准测试是否反映了模型真正的推理或概括能力,还是仅仅反映了其通过此类测试的能力。但剑桥大学计算机科学家 Marco Dos Santos 表示,由于 R1 是开放的,研究人员可以访问其思路。“这使得模型的推理过程具有更好的可解释性。”他说。
科学家们已经开始测试 R1 的能力。克伦要求两个竞争模型对 3,000 个研究想法进行有趣程度排序,并将结果与人工排名进行比较。根据这一衡量标准,R1 的表现略逊于 o1。但克伦表示,R1 在量子光学的某些计算上胜过 o1。“这相当令人印象深刻。”
当前新闻共有0条评论 | 分享到: |
|
||||||||||
评论前需要先 登录 或者 注册 哦![]() |
24小时新闻排行榜 | 更多>> |
1 | 体制内良心人士惊爆:中共外交部出大事了 |
2 | 传国母不伦恋震动中南海 |
3 | 62岁李连杰19岁抑郁症女儿交代后事 仪式从 |
4 | 中宣部泄漏习病情加剧?何立峰地盘受清洗 |
5 | 传与乌克兰电竞选手交往 女学生遭惩处后坠 |
48小时新闻排行榜 | 更多>> |
1 | 惊传:外交部官员携密件叛逃俄罗斯 倒逼王 |
2 | 马斯克,突爆大消息! |
3 | 不要看走眼,他才是结束习的“狠角色” |
4 | 刚刚,见证历史!近10万人爆仓 |
5 | 上海深圳爆倒闭潮 失业大军现街头 |
6 | 体制内良心人士惊爆:中共外交部出大事了 |
7 | 中美要打仗?美方私下动作惊人 |
8 | 传国母不伦恋震动中南海 |
9 | 62岁李连杰19岁抑郁症女儿交代后事 仪式从 |
10 | 清华博士不顾父母下跪哀求 执意出家为僧 如 |
一周博客排行 | 更多>> |
1 | 汪洋接总书记 张又侠不答应 | 胡亥 |
2 | 包子学歇业公告 | 阿妞不牛 |
3 | 当年举报毕福剑的张清遭天谴 | 体育老师 |
4 | 张大帅治国与党指挥枪 | 文庙 |
5 | 709 与 404 | 谢盛友文集 |
6 | 2024回国:华东行-黄山杭州 | 马黑 |
7 | 不低头的硬汉! 怀念北京大学 | 甲申秋立 |
8 | 说一下阎润涛 | 席琳 |
9 | Wow,今天MRNA疫苗股一枝独秀 | 体育老师 |
10 | 榨干了最后一块铜板,够狠够缺 | 席琳 |
一周博文回复排行榜 | 更多>> |
1 | MAGA主旋律.对等关税很正常.美 | 木秀于林 |
2 | 同志—称谓残简 | 阿妞不牛 |
3 | 两岸统一将会是一场腥风血雨的 | 山货郎 |
4 | 包子学歇业公告 | 阿妞不牛 |
5 | Wow,今天MRNA疫苗股一枝独秀 | 体育老师 |
6 | 俄乌战争:阿川第三张牛皮又吹 | 随意生活 |
7 | 说一下阎润涛 | 席琳 |
8 | 汪洋接总书记 张又侠不答应 | 胡亥 |
9 | 张大帅治国与党指挥枪 | 文庙 |
10 | 当年举报毕福剑的张清遭天谴 | 体育老师 |