中国AI人工智慧聊天机器人DeepSeek在周三发表的一篇论文中,公布了其R1模型的建构成本仅花费了24.9万美元,外媒指出,这笔钱“低得荒谬可笑”(ridiculously low)。
DeepSeek在先前的一篇研究论文中提到 ,其V3模型(类似于Claude等标准聊天机器人模型系列)的训练成本为560 万美元。
这个数字一直存在争议,一些专家质疑它是否包含了所有开发成本(包括基础设施、研发、资料等等),还是只包含了最终的训练运作成本。无论如何,这仍然只是OpenAI等公司建立模型所花费的一小部分,OpenAI执行长奥特曼本人估计GPT-4的成本超过1亿美元。
建立人工智慧模型需要耗费大量资源,包括资料、GPU、 资料中心的能源和水资源消耗、人员成本等等,这可能是一项成本高昂的任务,尤其是对于拥有更大训练资料集的更先进或更强大的模型而言。
对于中国实验室而言, 由于旨在抑制竞争的出口禁令, 取得美国制造的芯片也面临额外的障碍。据报道,DeepSeek能够透过策略性地优化旧芯片来创建成功的模型 ,这也使其拥有竞争优势。
DeepSeek 在论文中指出,它使用512块辉达H800芯片(一款性能较低、专为中国市场设计的产品)来构建R1版本。
DeepSeek发表的一篇论文中,公布其R1模型的建构成本仅花费了24.9万美元。(取自网络)