首页 > 业界 > 关键词  > 大模型涨价最新资讯  > 正文

告别价格战,大模型共迎通胀时代

2026-05-02 07:05 · 稿源: 锌刻度公众号

声明:本文来自于微信公众号 锌刻度,作者:陈邓新,授权站长之家转载发布。

眼下,涨价成为大模型的关键词。

迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。

以至于,国产大模型定价首次与海外头部厂商对齐。

大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

不愿贱卖成为行业的共识

曾几何时,降价才是大模型的竞争基调。

“全线降价”“两款产品免费”“百万Token一分钱”“比行业同类产品便宜90%”“免费、全面免费、永久免费”……

这一系列动作的背后,则是大模型为了长远发展选择牺牲短期利益。

通俗易懂地说,为了AI普惠需要不断降低大模型的Token价格,唯有此才可以在B端赋能千行百业、在C端成为标配的日常工具。

图片

Token成为大模型的重中之重

毕竟,将市场蛋糕越做越大才可以吃到规模化的红利,从而获得更大的势能。

阿里云资深专家朱迅垚曾表示:“阿里云大模型降价,是希望让更多的使用者和中小企业用上大模型,加速AI应用市场的提前爆发。”

百度智能云AI与大模型平台总经理忻舟亦表示:“大模型仍处于市场培育阶段,企业只有在认识到大模型带来的巨大价值后,才能将其应用于更大规模、更复杂的业务场景中。”

需要注意的是,大模型并非一味追求降价,也通过创新进行让利。

以2025年6月发布的豆包大模型1.6为例,一改行业之前的定价惯例:深度思考或多模态能力无需为Token额外买单,且Token的价格随着0—32K、32K—128K和128K—256K这三个输入长度的增长而增加,进行了分区定价,性价比更高。

图片

分区定价打破常规

不曾想,大模型价格只降不升的传统被打破了。

迈入2026年之后,GLM、Seedance、HY2.0Instruct等大模型或多或少有了提价的动作,特别是GLM-5.1在Coding场景的缓存命中Token价格接近Anthropic旗下大模型Claude Sonnet,这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐。

这意味着,大模型越来越不愿意贱卖Token了。

MiMo大模型负责人罗福莉表示:“我建议LLM公司在弄清楚如何在不造成资金流失的情况下为Coding方案定价之前,不要盲目地竞相压低价格。以极低的价格出售Token,同时对第三方敞开大门,这看起来对用户很有吸引力,但这却是一个陷阱——Anthropic刚刚摆脱的那个陷阱。”

简而言之,打价格战不如打价值战。

Token价格低,不意味着模型能力强,如若模型能力不足则会消耗更多的Token,进而导致更大的浪费,最终用户与大模型双输。

如此一来,大模型回归价值博弈成为一道必答题。

竞争焦点出现了转向

大模型从价格战走向价值战,背后的缘由有三。

首先,供不应求。

智能体时代,Token的长度从十万级向百万级、千万级跃迁,与此同时消耗量也实现了上百倍增长,成为大模型提高获客量的关键抓手。

之所以如此,与思考链路延长息息相关。

一问一答模式的Token消耗是线性增长,而智能体模式可以进行长链路思考、执行多重任务、完成循环调用等,Token消耗是指数级增长。

关于此,从智谱的数据就可见一斑。

2026年第一季度,智谱大模型的API调用定价提升了83%,而Token消耗量增长了400%,提高定价并未抑制需求,反而出现了供不应求的现象。

智谱CEO张鹏表示:“AGI时代的商业价值可以归结为一个简洁的公式:智能上界 × Token消耗规模,智能上界决定了定价权,Token消耗规模决定了价值体量。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token架构师,在给定预算下构建复杂 Agent系统并驱动大模型完成复杂Agent系统的自主运行。”

正因为如此,大模型的竞争焦点出现了转向。

大模型不再围绕参数、数量、打榜等指标比拼,而是转向拼应用、拼生态,因而性价比不再是唯一的关键指标,价值创造站到了C位。

譬如,混元3D世界模型2.0可以理解文字、图片、视频等不同类型的输入,自动生成3D场景,无缝对接游戏开发、AI漫剧等工作流。

图片

一句话生成3D世界

再譬如,GLM-5.1能够在一次任务中独立、持续工作超过8小时,成为当下唯一具备此能力的开源模型。

其次,分担成本。

大模型落地离不开云计算的鼎力相助,但云计算的成本肉眼可见的在不断增长,如此涨价成为必然。

以数据中心为例,一方面存储芯片等成为卖方市场,持续抬高新建成本;另外一方面由于是耗电大户,在能源价格高企的背景之下,运营成本被迫不断抬升。

不难看出,大模型服务比传统的互联网服务成本更贵。

更为关键的是,由于AI技术不断迭代,大模型也需要推陈出新,进一步推高了开支,亟须探索良性的、合理的商业化路径。

火山引总裁谭待曾有言:“对于企业级市场来说,商业模式是建立在可持续发展的基础上,任何商品必须是盈利的,不能靠补贴来降价。如果降价是亏损的,规模越大亏得越多,这就不是合理的商业模式。”

再次,胜者为王。

随着“百模大战”的演进,不少实力欠佳的玩家选择退场,即便是实力强劲的玩家也难以面面俱到,选择聚焦主航道。

Sora,就是最好的明证。

作为OpenAI旗下的AI视频生成工具,Sora诞生之初备受好评,视为AI生成视频赛道的颠覆性产品。

却不想,由于入不敷出,成为OpenAI的弃子。

图片

Sora寿终正寝

公开数据显示,Sora商用级内容的生成命中率仅5%~10%,生成一分钟高质量视频的推理成本为30~50美元,因而30天用户留存率为1%,60天留存率为0%。

简而言之,Sora并没有成为生产力工具。

其实,Sora不行,不意味着AI生成视频不行,Seedance、可灵等中国AI生成视频大模型不但技术过硬,更是不缺应用场景,最终上演了弯道超车。

“蓝鲸科技”报道:“Seedance2.0出来前,大多数模型每次只能生成一个5秒的视频,5秒里可能3秒都是废片,一个完整的镜头需要几个视频拼接,而Seedance2.0能够生成完整的15秒视频,运镜切换自如。”

Seedance之外,可灵的表现也可圈可点。

财报数据显示,2025年第一季度至第四季度,可灵的营业收入分别为1.5亿元、2.5亿元、3亿元、3.4亿元,虽然增速有所放缓,但整体依然处于增长的势态。

总而言之,大模型走过了采取低价甚至免费策略进行AI普惠的阶段,迈入了价值创造的阶段,为了更好地释放生产力,既要比拼模型的高效,也要比拼场景的适配。

那么,大模型竞速进入“深水区”。

举报

  • 相关推荐
  • 智算新纪,引航未来 国产AI智算生态创新突破(北京)交流会圆满举办

    2026年5月9日,国产AI智算生态创新突破交流会在北京举办,聚焦国产智算自主创新与场景落地。大会响应国家算力基础设施建设号召,汇聚政府、科研院所、企业等600余位代表,共同探讨技术突破与生态协同。会上成立AGC生态共同体,发布AGC系列智算产品,包括AGC-64F、AGC-64L等,旨在解决国产GPU通信瓶颈与算力损耗问题,推动国产智算从“可用”向“好用、普惠”迈进,助力数字中国建设。

  • 华为HMS for Car北京车展实车体验,海外AI大模型上线

    在2026年北京车展上,华为HMS for Car推出全新升级的一站式座舱生态解决方案,以AI为核心,整合AI Box、Map Box、Service Box和Net Box四大模块,解决海外市场地图更新滞后、多语言适配成本高、生态适配难和跨国网络接入管理等痛点。AI Box搭载大模型,支持多语言语音交互,Map Box提供实时导航,Service Box聚合全球生态,Net Box确保稳定连接,助力中国车企降低研发成本,加速全球化布局。

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • 百度智能云联合中国信通院共建AI终端生态 加速大模型落地消费电子

    5月14日,百度智能云联合中国信通院等30余家单位发起“智能终端大模型生态加速社区”倡议,推动消费电子产业在大模型时代实现生态协同、技术共创与标准共建。随着AI技术演进,智能终端正从功能设备向“智能伙伴”转型,但面临互联互通不足、开发门槛高、标准体系不完善等问题。社区将围绕技术攻关、市场研究、标准落地、测试认证、场景孵化、交流联动六大方向建设,通过开放协同机制降低创新门槛,打造开放、兼容、安全、普惠的AI终端生态,促进全产业链协同发展。

  • 获国家发明专利授权!淘车车自研AI定价数字人重构二手车定价体系

    近日,国内专业二手车交易平台淘车车宣布,其基于深度学习的二手车价格评估模型训练方法及装置获得国家知识产权局发明专利授权。该AI定价模型针对行业“一车一况”非标属性带来的主观偏差大、运营效率低、市场适配性弱等痛点,无需人工干预即可全流程自主定价,精度对标中高级评估师水平。该技术已在业务中落地为“定价数字人”,覆盖采购与销售环节,实现标准化、规模化定价。淘车车母公司Yusheng Holdings Limited已递交招股书,拟赴港上市。未来,淘车车将持续深化AI与交易场景融合,推动行业标准化、透明化发展。

  • 北京亦庄设立大模型生态服务站 助力AI产业合规发展

    2026年4月,经北京市网信办认定,亦庄模数世界大模型生态服务站正式成立,为企业提供公益大模型备案辅导、产业生态对接等一站式服务。该站由市网信办授权、经开区信息技术产业局指导、北京国际算力服务公司运营,采用“1对1精准陪跑+集中培训”模式,可将备案周期压缩50%以上,解决企业合规认知不足等行业痛点。同时,经开区对完成备案的优质大模型企业给予100万元专项奖励及1亿元算力、模型、数据券等支持,常态化开展合规培训与产业对接,助力北京经开区加快构建全域人工智能之城。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 普渡机器人正式发布具身智能大模型PuduFM 1.0

    2026年5月11日,普渡机器人发布具身智能大模型PuduFM1.0,构建三维空间深度感知、物理状态预测和持续进化学习三大技术维度,实现从“简单执行”向“物理认知”的跨越。该模型通过分层架构和虚实双数据闭环,解决行业在协作、操作和异构数据复用上的困境,支持超长程任务和异构机器统一运行,推动具身智能规模化落地。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

今日大家都在搜的词: