“DeepSeek告诉我们,投流的逻辑是不成立的。”正如阶跃星辰CEO姜大昕在近期媒体沟通会上所言,当DeepSeek以技术实力一鸣惊人,曾经喧嚣的“百模大战”逐渐降温,市场开始冷静地重新审视增长的本质。
昔日备受瞩目的“AI六小虎”,在资本与技术的双重考验下,已然分化,一个由字节跳动、阿里、阶跃星辰、智谱AI与DeepSeek构成的“基模五强”新格局正悄然浮现。它们凭借在资金、人才与核心技术上的深厚积累,或全面布局,或单点突破,在激烈的市场洗牌中占据了先机。
然而,牌桌上的玩家减少,并不意味着竞争的终结,反而预示着一场更高维度、更具决定性的较量已经拉开序幕。
在通往AGI的漫漫征途上,下一阶段的竞争焦点将不再是参数规模的比拼或是应用场景的浅尝辄止,而是直指两大核心“胜负手”:
● 一是能否持续推高基础模型的“智能上限”,尤其是在复杂的逻辑推理与认知能力上取得突破;
● 二是能否真正掌握并融合“多模态能力”,让AI能够像人一样全面感知、理解并与物理世界深度交互。
“无论是从AGI的定义还是AI应用的实际需求而言,多模态能力都是至关重要的。AI在视觉智能、空间智能、运动智能等任何一个方向出现短板,都有可能延缓AGI实现。”姜大昕表示。
国产大模型格局深度洗牌,新基模五强出现
中国的人工智能大模型领域,在经历了早期“百模大战”的喧嚣后,正迎来一场深刻的格局重塑。曾一度被誉为“AI六小虎”的几家明星初创企业凭借其技术积累和创新活力,在资本的密集下注中脱颖而出,与多家互联网巨头共同构成了国内大模型竞逐的第一梯队。
然而,市场的演进并未就此定格,技术迭代的加速与商业化路径的探索,正驱动着行业竞争格局向着更为集中的方向发展。
一个标志性事件,便是以DeepSeek为代表的技术新锐力量的崛起。DeepSeek凭借其在特定技术领域的突破,以及其坚定的开源策略和极致的工程优化能力,不仅如鲶鱼般搅动了原有的竞争态势,更在一定程度上加速了市场的分化。
其中,部分早期玩家不得不调整战略重心,或转向更垂直的应用场景,或寻求差异化的发展路径。在这一轮洗牌中,基础模型能力的重要性愈发凸显。业界共识逐渐清晰,无论是追求通用AGI的星辰大海,还是赋能千行百业的实际应用,都离不开强大、通用的基础模型作为支撑。
这种对基模核心价值的回归,直接催生了国产大模型市场重塑——以字节跳动、阿里、阶跃星辰、智谱AI以及Deepseek构成的“基模五强”新格局就此诞生。
值得注意的是,这种市场向头部集中的趋势并非中国独有。大洋彼岸的美国市场,同样呈现出OpenAI、Google、Anthropic、Meta以及X.ai等少数巨头引领的“五强争霸”局面。这似乎预示着,大模型这场高投入、长周期的“战争”,终将是少数实力派玩家的竞技场。
资金、人才和技术的“铁三角”
新“基模五强”之所以能够在这场激烈的角逐中占据领先地位,其背后是资本、人才与技术等多重关键因素的合力作用,共同构筑了它们的核心竞争力。
在资本层面,“烧钱”的大模型竞赛对资金实力提出了极高要求。字节跳动与阿里作为互联网巨头,凭借强大的内生造血能力和充裕的研发预算,为长期大规模投入提供了坚实保障。据称字节跳动2025年在AI领域的投入将达千亿级别,而阿里早已将AI置于集团核心战略,持续加码。
阶跃星辰与智谱AI则代表了“国家队”明星初创的成功融资路径。阶跃星辰在B轮融资中获得数亿美元,核心投资方包括上海国有资本投资有限公司及旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等,显示出上海市对其的全力支持。而智谱AI也获得了北京市海淀区政府的市场化投资平台中关村科学城的多次加注。
人才密度是大模型竞争的决胜高地,“基模五强”均汇聚了业内顶尖的技术领军人物和高素质人才团队。
字节跳动在张一鸣亲自督战AI后,广纳贤才,吸引了包括零一万物原联创黄文灏、阿里通义大模型原技术负责人周畅等一批业界精英。阿里由集团CEO吴泳铭统管AI战略,阿里云CTO周靖人担纲大模型研发,技术领导力突出。阶跃星辰的核心团队堪称“梦之队”,创始人姜大昕博士、首席科学家张祥雨、系统负责人朱亦博等均是行业翘楚,公司研发人员占比超过80%。智谱AI依托清华大学的技术底蕴,创始人唐杰、张鹏等在学术界和产业界均有深厚积累。DeepSeek团队则由标志性人物梁文锋领衔。
技术实力与前瞻性的战略布局,是“基模五强”得以引领市场的核心驱动力。在模型能力的构建上,它们展现出“全能型选手”与“专精型选手”的不同路径。
字节跳动、阿里、阶跃星辰和智谱AI均致力于打造覆盖语言、图像、语音、视频乃至多模态综合理解与生成的全面模型矩阵,并在各大权威评测中稳居第一梯队。
字节跳动凭借其深厚的工程能力和海量数据积累,在模型的通用性与规模化应用潜力上优势显著。阿里巴巴的通义大模型则以“开源王者”的姿态,率先且完整地向业界开放其技术能力,展现了其全面的技术布局。
阶跃星辰在短时间内便推出了超过二十款自研基座模型,其中多模态模型占比高达七成以上,被业界誉为“多模态卷王”;其Step系列语言大模型和多模态大模型在LiveBench、LMSYS Org Chatbot Arena等权威榜单上均有亮眼表现。智谱AI则通过GLM系列模型的持续迭代,从GLM-4基座大模型到对标Sora的视频生成模型CogVideoX,再到免费的多模态模型GLM-4V-Flash,构建了丰富的模型矩阵。
与之相对,DeepSeek更像一位“技术奇兵”,专注于在代码生成、数学逻辑推理等特定领域实现极致突破,并通过坚定的开源策略与高效的工程优化,迅速在开发者社区中建立影响力,以单点突破搅动市场格局。
基模竞争下一阶段的两大“胜负手”
“追求智能的上限仍然是当下最重要的一件事。”阶跃星辰CEO姜大昕在近期的发言中反复强调了这一点,直指大模型核心的认知与推理能力。模型的参数规模和数据量固然重要,但能否真正理解复杂指令、进行深度思考、并给出高质量的解决方案,才是衡量其智能水平的关键。
正如姜大昕所观察到的,自OpenAI发布o1到DeepSeek R1的惊艳亮相,“推理模型从一个趋势变成了范式,现在语言模型基本上是推理模型一统天下。”
在这一方向上,“基模五强”均在持续发力。DeepSeek凭借其在数学、代码等领域的强大推理能力,已经树立了技术标杆。字节跳动和阿里则依托其雄厚的工程实力和数据优势,不断优化模型架构,提升模型的综合认知水平。智谱AI聚焦高性能推理架构,通过轻量化设计和工具调用提升实际应用效率。阶跃星辰以多模态融合为核心,通过视觉、语音与推理结合探索AGI路径。
姜大昕也在媒体沟通会上表示,模型的突破是先于商业化的。不难看出,对底层智能上限的持续投入是阶跃星辰的核心战略。
如果说提升智能上限是让模型“更聪明”,那么多模态能力的构建则是让模型“更全面”,使其能够像人一样通过多种感官理解和交互世界。姜大昕对此有着明确的判断,“多模态是实现AGI的必经之路。”
“基模五强”在多模态领域的布局各有侧重,但都展现出高度的战略重视。阶跃星辰无疑是其中的“多模态卷王”,在其发布的22款自研基座模型中,有16款是多模态模型,占比超7成。
多模态能力的突破,也直接关系到Agent的成熟与爆发。姜大昕认为,Agent爆发需要两个必要的条件,一个是多模态的能力,另外一个是慢思考的能力,这两个能力恰好在2024年的时候取得了突破性的进展。值得关注的是,阶跃星辰已在智能终端、新零售等场景积极布局,快速进入“Agent时代”。
对智能上限的无尽追求和多模态能力的全面构建,已成为大模型下半场竞争的核心赛点。而新“基模五强”凭借各自的优势和战略定力,正在这两大方向上加速快跑。
文/辛夷
主题测试文章,只做测试使用。发布者:人脑网,转转请注明出处:https://www.rennao.com.cn/12513.html