DeepSeek新模型刷屏，推理能力比肩全球顶尖

幻方旗下AI大模型DeepSeek周末在海内外大幅发酵。

上周初公司发布一系列DeepSeek-R1模型，改模型推理能力优异，基准测试表现与OpenAI-o1相当，且API服务定价远低于OpenAI同类产品。

DeepSeek-R1-Zero在技术路线上实现了突破性创新，成为首个完全摒弃监督微调环节、完全依赖强化学习训练的大语言模型，证明了无监督或弱监督学习方法在提升模型推理能力方面的巨大潜力。在此基础上，DeepSeek-R1对R1-Zero进行了改进。通过引入冷启动数据，并历经推理导向强化学习、拒绝采样、监督微调以及全场景强化学习的多阶段训练，充分发挥了强化学习的自学习和自进化能力。

华尔街顶级风投A16Z创始人Marc Andreesen（投过OpenAI、Databricks）表示“DeepSeek R1是我见过的最令人惊叹，最令人印象深刻的突破之一，并且是开源的，是对全世界的大礼。”

长江证券认为，一方面，国产推理模型持续迭代，推理侧的scaling up将带来推理算力需求的显著提升；另一方面，通过利用DeepSeek-R1整理的80万个样本进行微调，小型模型推理能力显著提升，或加速垂类模型应用落地进程。华创证券也表示，AI大模型本质应落脚垂类应用，看好AI+应用产品力与商业化落地进程，细分包括办公、法律、医疗、教育、金融、传媒等。

此外，上周OpenAI发布Operator，国盛证券分析称，随着海内外各大科技厂商的大模型能力不断提升，大模型的应用发展也到了AIAgent新阶段。AIAgent落地的典型场景在C端可赋能各种硬件智能终端，如AI眼镜、AI玩具、智能家居等。

公司方面，据开源证券等表示，

AI+广告/电商：因赛集团、蓝色光标。

多模态数据语料：锋尚文化、每日互动、捷成股份等。

AI+影视上海电影、芒果超媒。

*免责声明：文章内容仅供参考，不构成投资建议

*风险提示：股市有风险，入市需谨慎