(原标题:DeepSeek“大杀四方”股票投资系统,大厂还有AGI梦想吗?) 21世纪经济报道记者白杨 北京报道 DeepSeek-R1推理模型上线不到一个月,已经搅得AI江湖“天翻地覆”。 DeepSeek-R1的API定价仅为OpenAI o1模型运行成本的3%,但在性能上,它又能比肩OpenAI o1,这意味着,DeepSeek实现了低成本与高性能的对齐。 更关键的是,DeepSeek将R1模型进行了完全的开源。IDC中国副总裁周震刚向21世纪经济报道记者表示,“DeepSeek的开源降低了人们使用高水平AI的门槛,将大大促进人工智能落地的趋势。” 这一趋势在过去一个月已经显现。不管是上游的芯片、云服务商,还是下游的应用,整个AI生态都在积极接入DeepSeek。C端市场,DeepSeek的表现同样抢眼,据QuestMobile数据,2月1日,DeepSeek日活跃用户突破3000万大关,成为史上最快达到这一里程碑的应用。 毫无疑问,DeepSeek的崛起,正加速AI的普及以及AI应用生态的繁荣。但随之而来的问题是,眼看着DeepSeek在市场上大杀四方,其他大模型厂商该如何应对? “六小虎”再寻路在DeepSeek-V3发布之前,整个中国AI市场弥漫着一股悲观气息。 英伟达芯片的限供,让中国大模型厂商在算力层面始终被束缚着手脚,同时,即便可以获得足量的芯片供应,高昂的算力成本也开始让许多大厂感到头疼。 某头部大模型厂商人士告诉21世纪经济报道记者,在去年的一次内部讲话中,他们公司高层就直言希望GPT5晚点发布,因为卡已经买不起了。 据记者了解,按照这家企业的财力,说买不起卡着实有些夸张,但这番表态背后,也折射出中国大模型厂商当时的焦虑——在规模法则(Scaling law)放缓的背景下,追求更大规模模型的效率在变低,许多企业担心大量成本投入进去后,模型性能无法以正比呈现。 在此背景下,中国2023年“百模大战”的热闹景象也成为昙花一现,到了2024年,仍然在做预训练模型的厂商已经屈指可数。 在大模型最典型的创业代表——零一万物、百川智能、阶跃星辰、智谱AI、月之暗面、MiniMax等“六小虎”中,零一万物是最先表态不再追求超大模型的。 2025年初,零一万物和阿里云合作成立了产业大模型联合实验室。零一万物CEO李开复当时称,从商业角度考虑,只有大公司能继续做超大模型。而零一万物将依赖大厂训练更大规模的模型,来帮助自己提升轻量化模型的性能。 2月14日,零一万物与苏州高新区联合成立的产业大模型基地正式授牌,该基地将重点打造制造、金融、医疗、政务等多个领域的行业大模型解决方案。 而百川智能将目光聚焦到了医疗模型和产品。2月13日,百川智能以Baichuan-M1为底座打造的“AI儿科医生”经过近一个月的内测后,已经在北京儿童医院“上岗”。 此外,月之暗面今年曾和DeepSeek-R1“撞车”。1月20日,在DeepSeek-R1发布的同一天,月之暗面也发布了Kimi k1.5多模态思考模型,但该模型并未引起太大关注。 近日有媒体报道称,月之暗面已经因DeepSeek开始调整工作重心。月之暗面一位研究员还反思称,公司一年前就验证过长思维链,但因为成本高先做了长文本。这也暴露了创业公司的弊端,很可能因为资金问题错过前沿突破的机会。 至于剩下“三小虎”,智谱AI近期在发力其模型产品的ToB合作,MiniMax和阶跃星辰则都分别发布了最新的多模态模型。需要指出的是,目前阶跃星辰和MiniMax均已在其产品中接入了DeepSeek。 DeepSeek的出现,让外界对于“六小虎”未来的发展路径充满了担忧。李开复甚至表示,当预训练结果已经不如开源模型时,每个公司都不应该执着于预训练。尤其是创业公司,更需要考虑商业化的问题。 随着模型性能的提升与推理成本的下降,2025年被视为中国大模型赛道的商业化拐点。一位行业分析人士向记者表示,中国大模型行业正由早期的预训练赛道向应用落地和商业模式优化转变,对“六小虎”们而言,今年的决胜点将是大模型能力的商业落地。 大厂仍会追求AGI受到DeepSeek冲击的除了“六小虎”,还有字节跳动、阿里巴巴和腾讯等大厂们。 某大厂员工告诉21世纪经济报道记者,DeepSeek-R1发布时,其团队正在外地进行团建,随后被公司高管紧急叫停,全员回到公司来应对这一变化。 另一位大厂员工则向记者表示,其管理团队去年曾表示,通用大模型在不断收敛,未来只有大厂才有机会,而六小虎都是在给大厂进行试错。 但DeepSeek的出现,似乎让整个市场在大厂之外,看到了另外一种可能。不过仔细分析DeepSeek会发现,它其实并不是像六小虎一样的创业公司,而是“初创+隐形大厂”的打法。 自2023年诞生以来,DeepSeek就没有启动过融资,其背靠的是资源量不亚于大厂的量化巨头幻方,这使得DeepSeek拥有了足够的资金、芯片等资源,同时也让DeepSeek有底气去“不计商业回报”的追求AGI。 因此大厂们与创业公司不同,DeepSeek的成功反而会激发其斗志。上述大厂员工就表示,“如果DeepSeek能,我们为什么不能?” 周震刚表示,DeepSeek应用的很多技术,其实都不是刚出现的,但DeepSeek在这些基础上做了许多新的功能化应用,所以DeepSeek的成功也是工程化优化的结果。 因此对其他有实力继续投入的大厂来说,未来也增加了许多想象空间。比如DeepSeek通过算法优化,用一万张卡做出了别人十万张卡的模型,那如果有人用十万张卡,沿着DeepSeek这种工程模式,会训练出什么效果的模型? 再或者通过其他方式的优化,能否用一千张卡就实现十万张卡的效果?这些都需要大厂们继续探索来回答。 而现阶段,大厂们则需要通过调整策略,来应对短期内DeepSeek的影响。对字节跳动而言,去年其投入大量资源做豆包App的营销,日活已经达到1695万,成为行业第一,但今年很快就被DeepSeek超越。 对此,字节跳动CEO梁汝波近日也在内部全员会上反思,“DeepSeek R1创新点之一的长链思考模式不是业界首创。去年9月OpenAI发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但跟进速度不够,如果当时及时关注到,有机会更早实现。” 对于2025年,梁汝波提出,字节跳动在AI业务上的目标是追求“智能”上限、探索新的交互和加强规模效应。 而在大模型时代一直强调“稳扎稳打、不急于求成”的腾讯,面对DeepSeek却一反常态,在业内率先开启了全面拥抱。截至目前,腾讯元宝、微信、ima、腾讯文档、QQ浏览器、QQ音乐等多款腾讯产品均已接入DeepSeek-R1模型。 腾讯拥有自研的混元大模型,此前,腾讯内部很多团队也使用外部开源模型,但都逐渐收敛至混元。而这次,腾讯却给予了DeepSeek与混元平起平坐,甚至要高于混元的待遇。 作为拥有超10亿月活用户的国民级产品,微信团队的风格向来谨慎。去年微信搜一搜就加入了混元大模型能力,但也是隐藏在搜索功能当中,即用户需要先进行搜索,然后在搜索结果中,才会有大模型能力的呈现。而现在,为了DeepSeek,微信单独开发了“AI搜索”的入口。 有行业分析人士告诉21世纪经济报道记者,腾讯此次面对DeepSeek的快速反应,体现了其“产品为先”的经营策略。尤其是微信,过去没有为混元单独开放AI搜索的入口,说明微信并没有因为混元是自家产品,就降低对其的要求。 不过,腾讯方面也向记者表示,腾讯产品接入DeepSeek,并不意味着放弃自研。相反,通过接入DeepSeek,会以赛马的方式倒逼混元的快速迭代,以及推动各产品加快场景建设。 对于未来大模型市场格局,浪潮信息高级副总裁刘军在接受21世纪经济报道记者采访时表示,未来大模型市场不会是单一垄断,而是多个模型并存。 “DeepSeek之所以受到全球欢迎,是因为它打破了OpenAI的封闭垄断模式。通过开源,用户不仅仅是消费者,还可以成为创造者,这有助于激发全球各个层面的创新活力”。刘军说,“就像两年前Llama刚开源,全球都在拥抱Llama一样,现在全球都在拥抱DeepSeek-R1,这也构成了一个多模齐放的生态,相信未来也会有更优秀的模型继续出现。”
|