标题改写:智谱策划对DeepSeek实施出其不意的战略行动

admin352025-04-01 12:40:33

标题:智谱科技激战DeepSeek:创新模型与开源战略并行,大模型商业之路探析


文章来源:虎嗅科技组

作者:宋思杭

编辑:苗正卿

头图:智谱Openday现场


智谱科技,这个在短短一个月内成功吸引三轮国资投资的“国家队”,终于亮出了与DeepSeek正面交锋的底牌。

3月31日,中关村论坛闭幕式现场,智谱科技发起了一场蓄势已久的反击。

创新产品,以小博大

当天,智谱科技在智能体产品和基座模型两大领域,分别推出了“AutoGLM沉思模型”和推理模型GLM-Z1-Air(简称“Air”)。值得一提的是,智谱科技不仅在“以小搏大”的策略上再次发力,还宣布其Air模型仅用32B参数即可与DeepSeek R1模型的671B参数相媲美,且价格仅为DeepSeek R1模型的1/30。

首次发布推理模型,剑指DeepSeek

这是自2025年以来,大模型领域的“六小虎”中首个发布推理模型,并宣布能够与DeepSeek媲美的AI独角兽。然而,仅仅在性能上与DeepSeek匹敌还不够,智谱科技还需要更高的筹码来达到反击的效果。

开源策略与商业化并行

在本次发布会上,智谱科技以每百万tokens 0.5元的价格反击DeepSeek,并且宣布该模型将于2025年4月14日正式开源。

大模型圈的战略摇摆与预训练的回归

围绕2025年的大模型圈,“预训练”已经很难再次成为关键词。目前,大模型领域的“六小虎”中已有两家出现严重的战略摇摆。其中,百川智能大批核心成员离职,并砍掉了包括在B端大模型商业化进程最快的金融业务和互联网业务;而零一万物则是主动放弃万亿参数赛道,全面转向B端业务。

智谱科技:坚持预训练,关注未被关注的点

智谱科技创始人兼CEO张鹏表示:“我们仍然会坚持预训练,但更深一层的问题是,目前关于预训练有很多没有被关注到的点,比如预训练的架构、数据使用效率等等。”

DeepSeek的降维打击与行业的余震

自2025年以来,DeepSeek对所有基座模型形成的降维打击,正在持续给整个行业带来余震。许多投资人开始质疑:“DeepSeek做得那么好,为什么还要投你?”然而,在DeepSeek发布之前,大模型领域的“六小虎”曾是他们无法触及的明星。

资本对大模型初创公司的耐心逐渐消退

从整个第一季度来看,资本正逐渐对大模型初创公司失去耐心。可以说,除了智谱科技连续拿到地方产投融资外,目前并无市场化资本进入到其余大模型企业当中。

智谱科技:开启新旅程,商业化布局多端并行

与此同时,这种降维打击所暴露出的另一面是,即使是用百亿元砸出来的预训练,也没能让基座模型厂商形成护城河。商业化难题,是大模型企业这三年来都没能绕过去的门槛。继拿到多笔国资后,智谱科技也即将开启新旅程。

商业化前景不明朗,智谱科技能否顺利走下去?

在商业化布局方面,智谱科技正在以端侧为切口,渗透到金融、教育、医疗、政务等七大行业。在海外方面,智谱科技还在本次发布会上正式宣布与东盟十国及“一带一路”沿线国家共建“自主大模型共建联盟”。

智谱科技:不做ToB公司,专注于有意义的事

当谈及智谱科技是否侧重B端时,张鹏坦言道:“我讨厌标签,智谱也并不是一家做ToB的公司。我们只做自己认为有意义的事。”

大模型商业化难题待解,价值体系重构战全面爆发

这场商业博弈的底层逻辑,需建立在B端场景的短期盈利闭环之上。然而,行业见证的是,价值体系重构战役的全面爆发。

DeepSeek的“成本优势+开源”组合拳,大模型创业公司如何应对?

自2025年初DeepSeek以“成本优势+开源”一套组合拳撕开市场缺口,头部云厂商能够依托生态优势迅速卡位,而大模型创业公司也只能利用价格来力挽狂澜。

智谱科技:制造奇袭,给DeepSeek造成“亿点”冲击

也许,智谱科技希望通过制造这场奇袭,给DeepSeek造成“亿点”冲击。

以下是与智谱科技CEO张鹏的对话实录:

(Q:如今DeepSeek给大模型公司造成了或多或少的冲击,您刚刚也提到Air模型将于4月14日开源。智谱科技的开源策略和商业化如何形成互补?

张鹏:开源是我们智谱从第一天开始就坚持的事情。宣布2025年是我们的开源年,是考虑到当下,尤其是DeepSeek发布之后对于整个技术生态的影响,大家认知上的影响。我们觉得从开源角度可以加大一些力度。

(Q:现在大家很少提预训练大模型的能力,你怎么看预训练大模型基础的能力?另外RL、CoT这种后训练的模型推理能力,让推理模型能力逐渐提升,而且提升的性价比从用户端感知可能是比较好的。你觉得推理模型的天花板在哪里?主要使用场景在哪里?

张鹏:对于预训练这件事情,今天早晨我们在一个圈子里讨论问题,也是不断的学习。大家反共识的点在于什么呢?预训练仍然很重要。为什么仍然很重要?预训练虽然现在关注度不那么高,但是后面的RL或者各种方法也好,其实本质上还是依赖预训练所带来的基座模型天花板,无论是RL等等也好,都是在深度更大的程度挖掘、逼近这个天花板,这个天花板是隐形的。但是预训练仍然很重要,当然预训练里面的问题非常多,或者待研究的点非常多,预训练的架构、数据使用效率甚至是训练计划怎么优化?就像我们说的智能体的学习一样,是不是需要有易到难的过程,还是无序的进行预训练?这里面还有很多问题需要去研究。

(Q:智谱科技今年融资计划主要有哪些方向?哪些地方需要大笔投?

张鹏:这和AGI目标有关系,我们判断实现AGI的路程还很长,这个过程中需要很多技术探索和研究投入,成本非常可观。要知道,从0到1的开拓和从1到10的复制,这两个之间的成本不可同日而语。前者的试错成本相对更高,这是不可避免的,我们不希望永远走在别人后面,我们现在已经走在前面,而我们走在前面的这部分需要加大投入做这些事情。

(Q:智谱科技在Agent领域已经有一定布局,本次新产品的推出是否意味着公司在这方面的调整?未来公司在Agent的规划是怎样的?

张鹏:我们对Agent领域的投资确实很早,2023年我们开始在这一块投入,大家还在拼基座模型、训练大模型和预训练的时候,我们就在这里投入了。站在AGI实现路径上,我们是从L1的预训练到L2的对齐和推理,再到L3的工具使用包括Agent的使用,一级级延续上去的。所以,不能说今天的发布会表示着我们的Agent战略有非常巨大的变化,只是到了当下这个阶段,我们会认为进入到一个可以有更大规模应用和落地的阶段。

(Q:你认为下一代Agent的核心能力是什么?AutoGLM系列未来的迭代方向是否包括多模态或者是具身智能?

张鹏:Agent的核心能力无非是两种,第一个是模型本身能力,包括底层的语言能力、多模态能力和推理能力。第二点是感知环境和环境智能交互,也就是Agent强调的沟通交流能力。这两点我认为是智能体能在应用层面爆发,能够落地产生实际效果的两个核心价值。

(Q:现在大多数Agent都是在桌面端,智谱科技发布的也是在桌面端。您认为未来会不会有更多的入口?当前的话我们要在手机上,未来有没有在AI眼镜上调用Agent的能力,去实现我想达到的目标?现在要调用更多的入口还有哪些挑战?

张鹏:其实这个事情我们已经在做了,只不过今天这个场合突出重点,我们拿了通用场景来说。包括更多的端,AutoGLM更早是手机端,今天只不过是把它移到PC上。其他智能上的硬件,眼镜、汽车、平板等等的端侧,都可以接。但是里面确实有一些问题,不同类型的设备,最终的交互方式不一样,比如说眼镜不可能有键盘,就得用语音交互,语音就引入了全新的模态。如果说产品里面有明显的短板,这个事情就成不了,链条上缺了一环你就做不了,好在整体的能力是齐的,仍然是有高有低。

(Q:智谱科技自己有想做具身智能吗?

张鹏:我们会有相应的布局,这个事情可能还需要一点时间。

(Q:您刚才提到现在坚持预训练的模型,很多家企业已经放弃了。那现阶段公司从战略层面来讲,技术和商业化战略层次和人员、资源的分配大概是什么样的情况?

张鹏:这是战略层面问题。我们把自己定位成技术驱动的公司,另外一条腿是我们的商业化路径。这两条腿并不是互相矛盾的,也不是互相争抢资源,我们是动态调整的过程。我们觉得技术的推进和演进,到了一个必须要深入到产业和应用当中去,吸取营养回馈我们技术研发的阶段。所以才会在这个阶段从去年开始大力推进产业化、商业化落地这件事情,会有资源投入。但是从整体的核心任务和资源投入角度来讲,我们还是投入在技术研发、创新更高一些。

(Q:很多投资人认为是今年传统行业大规模应用爆发的一年,智谱科技也是最早做Agent。那么在落地层面,公司在2025年预期是怎样的,Agent目前急需解决的问题有哪些?

张鹏:今天是Q1的最后一天,今年的很多事情还在计划当中。拿去年来说,我们拉齐看了一下,还是很不错的,整体实现了超过100%的增长速度,很多头部行业已经打进去,有一定规模化的效果。今年我们会认为因为市场变化,会让市场呈十倍以上的增长,机会是更大的,但是整个模式和商业路径会有一些调整。但我们还是保持一贯稳定的商业化落地速度和效益,持续提升商业化落地的效果。因为作为一个企业来讲,最终的目的还是要挣钱,不挣钱不行。


本文来自虎嗅,原文链接:https://www.huxiu.com/article/4184318.html?f=wyxwapp