科技行业：DeepSeek强势崛起，产业链影响和我们的思考

167

科技行业：DeepSeek强势崛起，产业链影响和我们的思考

# 行业点评大小：0.35M | 页数：10 | 上架时间：2025-02-08 | 语言：中文

上传者: 大力研报

出版日期: 2025-02-07

摘要：DeepSeek强势崛起。1月22日前后，杭州深度求索公司DeepSeek发布两款开源人工智能大模型（DeepSeek-R1/DeepSeek-R1-zero）并取得与海外领先模型相似或者更好的性能。两款模型基于之前发布的DeepSeek-V3，其训练仅用280万小时的英伟达H800 GPU算力（约560万美元）。我们认为，国产高效开源模型的兴起意味着大模型的训练和推理成本或有大幅度降低，引发了投资者关于杰文斯效应（Jevons Paradox）的讨论。多项技术都有实质创新。我们总结DeepSeek-V3和DeepSeek-R1在算法架构、预训练、后训练和蒸馏提炼阶段的创新，我们发现DeepSeek结合硬件、算法和系统，使用定制化的PTX等底层算法达到流水线并行，同时优化了存储，减少了通信的报头开销。因为直接调用硬件，我们认为这些创新或不能通过高级语言实现，这或意味着英伟达CUDA的竞争壁垒有所松动。对于部分投资者所持DeepSeek各项创新都曾单独被尝试的说法，我们认为，如何高效结合不同算法以及软硬件从而打通整个系统是工程问题最核心的难点。海外芯片影响分化，直接利好国产半导体产业链。对于数据中心芯片，我们认为高效开源AI模型的崛起降低了模型训练的门槛和成本，这或使下游对于高端GPU加速器的需求更加理性。推理方面，高效AI或降低模型推理的门槛，但成本降低或让推理需求增大，从而弥补单价下降的影响。对于英伟达来说，其Blackwell或依然在2025年上市前期供不应求，但其最高端芯片的训练需求的可持续性或受到影响。我们同时认为对AMD、博通和迈威尔的长期影响则相对温和甚至正面。我们认为从硬件性能上，包括华为昇腾在内的国产算力芯片接近或达到英伟达Hopper系列芯片水平。而算法对底层的优化或加速国产模型使用国产芯片，同时利好包括晶圆代工、半导体设备等国产半导体产业链。长期或利好端侧AI；软件、AI服务提供者或直接受益。我们认为，从长期看，模型门槛降低或加速生成式人工智能在端侧的部署，加速消费电子产品的升级换代，普遍利好端侧芯片和设备OEM。我们对于端侧部署AI的前景较此前更为乐观，虽然具体需求增长的数量和换机的时机尚不确定。我们认为，通过提供生成式AI为垂直行业提供服务的软件公司（包括海内外）或是高效开源大模型成功开发的最直接受益者。软件企业使用大模型的成本降低，且可通过大模型提高开发效率。对于云服务提供商（CSP），我们认为以闭源模型为主要商业模式、且有大量资本投入的公司，其模型IP上的优势变小。对于开发开源模型，通过大模型促进云业务增长实现变现的公司，或在生成式人工智能进一步广泛应用后受益。我们总结了海外科技企业1月23日以来发布业绩后管理层关于DeepSeek的初步反馈。各家公司对于DeepSeek的表态都比较正面，认为DeepSeek在降低推理成本、提升效率方面有重大创新。同时，DeepSeek的出现进一步表明人工智能领域将有一个开源标准。此外，微软、谷歌和Meta Platforms均表示在人工智能方面资本开支依然大力投入。

展开>> 收起<<

请登录，再发表你的看法

大力研报

关注