万维读者网 > 数码科技 > 正文  

“低得荒谬可笑” DeepSeek R1模型惊人成本曝

www.creaders.net | 2025-09-22 11:38:48  自由时报 | 0条评论 | 查看/发表评论

中国AI人工智慧聊天机器人DeepSeek在周三发表的一篇论文中,公布了其R1模型的建构成本仅花费了24.9万美元,外媒指出,这笔钱“低得荒谬可笑”(ridiculously low)。

DeepSeek在先前的一篇研究论文中提到 ,其V3模型(类似于Claude等标准聊天机器人模型系列)的训练成本为560 万美元。

这个数字一直存在争议,一些专家质疑它是否包含了所有开发成本(包括基础设施、研发、资料等等),还是只包含了最终的训练运作成本。无论如何,这仍然只是OpenAI等公司建立模型所花费的一小部分,OpenAI执行长奥特曼本人估计GPT-4的成本超过1亿美元。

建立人工智慧模型需要耗费大量资源,包括资料、GPU、 资料中心的能源和水资源消耗、人员成本等等,这可能是一项成本高昂的任务,尤其是对于拥有更大训练资料集的更先进或更强大的模型而言。

对于中国实验室而言, 由于旨在抑制竞争的出口禁令, 取得美国制造的芯片也面临额外的障碍。据报道,DeepSeek能够透过策略性地优化旧芯片来创建成功的模型 ,这也使其拥有竞争优势。

DeepSeek 在论文中指出,它使用512块辉达H800芯片(一款性能较低、专为中国市场设计的产品)来构建R1版本。

“低得荒谬可笑” DeepSeek R1模型惊人成本曝

DeepSeek发表的一篇论文中,公布其R1模型的建构成本仅花费了24.9万美元。(取自网络)

   0


热门专题
1
美伊冲突
6
俄乌战争
11
大S
2
以伊战争
7
万维专栏
12
洛杉矶大火
3
四中全会
8
何卫东
13
叙利亚
4
中美冷战
9
AI
14
苗华被抓
5
川普
10
中共两会
15
美国大选
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.