这也意味着,DeepSeek证明了自己的确可以做到“以不到600万美元的训练成本(可以理解为净算力成本),完成一个性能接近巨头的模型”。
不过,半导体市场分析和预测公司SemiAnalysis指出,557.6万美元这个数字主要指的是模型预训练的GPU成本,考虑到服务器资本支出、运营成本等因素,DeepSeek的总成本在4年内可能达到25.73亿美元。
不可忽略的是,创新成本下降的趋势早已开始,DeepSeek只是加速了这一进程。方舟投资管理公司的创始人兼CEO“木头姐”指出,在DeepSeek之前,人工智能训练成本每年下降75%,推理成本甚至下降85%到90%。
英诺天使基金合伙人王晟也有相同看法,比如年初发布的模型,到年底再发布同样的模型,成本都会有大幅度下降,甚至有可能降至1/10。而且OpenAI作为闭源模型,对外披露的算力成本也有虚高的可能性,因为要留部分利润空间,也要不断对资本市场强化成本很贵的故事,以此得到更高的投资。
不过,DeepSeek的可贵性并不仅仅在于“便宜”,更在于它是一个“屠龙少年”的故事。