巨头加码，AI泡沫来袭？

加码基础设施投资、抢占竞争制造点的同时，能否在此基础上形成强大的生态系统，进而形成商业闭环，却更为关键。AI军备竞赛会否导向算力泡沫，也值得市场警惕。

南方周末科创力研究中心

责任编辑：黄金萍

2025年2月24-28日，DeepSeek陆续开源FlashMLA、DeepEP、DeepGEMM、3FS项目，以及DualPipe、EPLB等代码库，并在其“开源周”收尾时，又放了一枚深水炸弹。

3月1日，DeepSeek发布《DeepSeek-V3/R1推理系统概览》，公开其模型理论成本利润率可达545%。

DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。为此，DeepSeek使用大规模跨节点专家并行（Expert Parallelism/EP）：首先EP使得batch size增加，从而提高GPU矩阵乘法的效率，提高吞吐；其次EP使得专家分散在不同的GPU上，每个GPU只需对应很少的专家（因此访存的需求更少），从而降低延迟。