万维读者网 > 数码科技 > 正文  

知名半导体研究机构给Deep Seek算了一笔账

www.creaders.net | 2025-02-01 10:13:10  香港01 | 0条评论 | 查看/发表评论

亲中共媒体香港01报道:中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元(约39亿港元)。

DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元(约4,349万港元),低廉的成本引起关注。

文件注明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。

半导体研究与谘询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高于5亿美元(约39亿港元),并指研发成本和整体成本也相当可观,称为模型训练制作“合成资料”需要大量的计算力。

报告称“为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。”

2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元(约4.9亿港元)。

   0


热门专题
1
俄乌战争
6
大S
11
美国大选
2
中共两会
7
中美冷战
12
以哈战争
3
川普
8
洛杉矶大火
13
巴黎奥运
4
万维专栏
9
叙利亚
14
三中全会
5
AI
10
苗华被抓
15
台湾大选
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.