亲中共媒体香港01报道:中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高于5亿美元(约39亿港元)。
DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元(约4,349万港元),低廉的成本引起关注。
文件注明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。
半导体研究与谘询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高于5亿美元(约39亿港元),并指研发成本和整体成本也相当可观,称为模型训练制作“合成资料”需要大量的计算力。
报告称“为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。”
2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元(约4.9亿港元)。
作为一家中国AI初创公司,DeepSeek在海外遭到诸多质疑。(Reuters)