首页 > 业界 > 关键词  > AI文生视频最新资讯  > 正文

即梦VS可灵,下一步战火烧向何方?

2025-05-25 21:00 · 稿源: 壹娱观察公众号

声明:本文来自于微信公众号 壹娱观察,作者:大娱乐家,授权站长之家转载发布。

字节跳动的即梦AI与快手的可灵AI在国内文生视频赛道激烈厮杀时,大洋彼岸的谷歌 I/O2025却悄然为这场竞争指明了新的方向。

此刻,国内的AI文生视频产品无疑迎来了双雄争霸的格局。

一方面,即梦AI在字节跳动网传120亿美元下注AI的激进投资战略里占据重要位置,且实现了用户飞速增长;另一方面,可灵AI自商业化以来至今年2月累计营业收入超1亿元,在全球的文生视频性能评测中表现亮眼,成为快手2024年度财报里的重点笔墨。

图片

即梦、可灵展开多方合作

然而,在全球眼光审视市场之下,谷歌5月21日所发布的Veo3.0、Flow AI电影制作工具,展现的不仅是技术突破,更是一套完整的生态化商业思路,本质上揭示了一个更深层的问题——单纯的模型能力竞争可能正在走向死胡同。

真正的护城河不在于某个技术的领先,而在于如何构建完整的AI驱动生态系统。当国内两家平台还在比拼性能指标或用精雕细琢的成品展示时,谷歌已经开始思考如何让AI驱动的文生视频能力融入用户的完整工作流程。

这种差距,正是国内AI视频生成赛道需要正视的现实。

AI视频赛道走向

“生态为王”

谷歌I/O2025最令人印象深刻的,并非某个单一产品的性能提升,而是其展现出的系统性思维。

Veo3首次实现原生音频生成——街道交通噪音、鸟儿歌唱、甚至角色对话。这一突破体现了谷歌对多模态融合的深度理解。

更值得关注的是,谷歌并未将Veo3.0作为独立产品推出,而是深度整合到名为Flow的AI电影制作工具中。

Flow汇集了Veo、Imagen和Gemini三大模型,让用户无缝创建电影片段、场景和故事。

其背后是谷歌的全新思考——用户需要的不是孤立的生成工具,而是完整创作流程的一体化解决方案。从镜头控制到场景构建,每个功能模块都指向同一目标:让AI融入创作者的工作流程,而非简单替代某个环节。

这种生态化思维在订阅体系设计中体现得更明显。

全新打造的谷歌AI Ultra定价249.99美元/月,不仅拥有全套AI技能包,同时还包含YouTube Premium、30TB云存储,以及早期访问Agent Mode——用户只需陈述目标,Gemini就会智能协调调用工具以实现。

谷歌当前的商业化思路展现出三个关键特点:

  • 将基础模型能力进行生态化释放。Veo3.0的原生音频生成让视频创作更完整沉浸。用户通过简单文本提示同时生成视听内容,创作效率出现质的飞跃。

  • 围绕订阅体系对AI产品重新定价。谷歌 AI Ultra的高价格是为整个AI生态系统重新定价,将AI工具从效率提升工具升级为专业创作者的核心生产力平台。

  • 技术护城河的系统性构建。通过深度整合多个基础大模型并嵌入各个常规产品,谷歌形成了难以被单点突破的技术壁垒。

总结而来,生态化思维将竞争从技术性能比拼转向用户价值的深度挖掘。

当谷歌能提供从内容生成到编辑制作的全流程解决方案时,用户迁移成本大幅提升,平台商业价值得到根本重塑。

更重要的是,谷歌展现的不仅是当前产品能力,更是对AI发展趋势的前瞻判断。未来竞争将不再局限于内容生成,而是扩展到AI如何帮助用户完成复杂的跨领域任务。

国内双雄的进阶之路:

从拼技术到比生态

面对谷歌 I/O2025展现出的技术能力与生态化思维,正在国内市场进行激烈竞争的可灵AI和即梦AI都面临着战略转型的关键节点。

两家平台虽然在技术能力上可以说各有千秋,但在生态化布局和商业模式创新方面,仍有巨大的提升空间。

一是对多模态能力的全盘整合。

即梦AI3.0以电影级画质和2K分辨率输出见长,其VeOmni框架和增强型Goku AI模型展现了字节跳动的技术实力;可灵AI2.0引入了多模态视觉语言(MVL)概念,通过TXT和MMW实现更精准的创意表达。

图片

可灵(左)即梦(右)截图

而相比谷歌将Veo、Imagen、Gemini三大模型深度融合的做法,两家平台的整合程度还有待提升。

  • 即梦AI应该在主打高效生成的海草S2.0与更强调叙事创作的PixelDance P2.0Pro等多个专业文生视频模型之间建立更紧密的协同关系;

  • 可灵AI则该考虑将其视频生成能力与可图2.0的图像生成能力进行更深层次的融合;

  • 最关键的是,两家平台都应该将音频生成能力的研发提上日程。Veo3.0的原生音频生成不仅提升了视频内容的完整性,更为沉浸式内容创作开辟了新可能性。

图片

谷歌Veo3实现音画同步生成功能

二是如何构建订阅体系以实现技术泛用。

目前,即梦AI的周活跃用户在几个月内增长近三倍,显示出强劲的用户吸引力;可灵AI主要通过API调用和企业合作实现变现,自商业化以来至今年2月累计营业收入超1亿元。

然而,两家平台都缺乏面向个人用户的系统性订阅产品。谷歌 AI Ultra249.99美元/月的定价策略提供了重要参考:AI工具的价值不应该仅仅基于生成次数或质量水平,而应该基于其为用户创造的完整价值链。

  • 即梦AI可以利用其精准英文字体排版能力和全球发布策略,针对不同区域市场开发差异化的订阅产品;

  • 可灵AI可以考虑推出包含创作工具、素材库、分发渠道、甚至变现支持的一体化订阅服务。

三是对创作生态的构建完善程度。

字节千亿级别的AI基础设施投资和大模型技术投入为即梦AI提供了能力不俗的技术底座,但如何将这种技术优势转化为生态优势,依然是即梦AI需要重点思考的问题。即梦AI或许还需要进一步依靠TikTok的全球创作生态,去构建一个面向国际创意社区的完整创作链条。

快手平台拥有庞大的内容创作者群体和完善的商业化体系,这为可灵AI构建生态闭环提供了得天独厚的条件。接下来,可灵AI可以学习谷歌Flow的设计思路,开发一个深度整合快手生态的创作工具,让用户从创意构思、内容生成、到发布推广、商业变现形成完整闭环。

最后则是AI Agent的发展路径。

谷歌Agent Mode的推出预示着各类型的AI工具正在从被动的内容生成器向主动的工作流助手转变,文生视频也不例外。

对于两家平台而言,这意味着需要将文生视频生成能力与更广泛的创作和商业流程进行整合。

即梦AI的多模型调用策略为开发AI Agent提供了良好基础,但需要在模型间建立更智能的协调机制;可灵AI的多图参考功能已经展现了一定的智能化水平,但距离真正的泛用型AI助手还有明显差距。

当然以上这些都还是建立在最底层大模型能力的持续进步之上。当下谷歌能够实现如此强大的多模态整合能力,与其丰富的数据资源和先进的训练方法密不可分。

字节跳动与快手,虽然都拥有海量的用户生成内容,但如何更好地利用这些数据资源,提升基础大模型的泛化能力和应用效果,仍需要持续探索。

尤其是对快手而言,一开始便选择强攻文生视频这一支线虽然取得一定先发优势,但需要对基础大模型能力的强化提前加以重视,以防在某一时刻成为其整个产品生态的软肋。

从谷歌 I/O2025的发布来看,AI视频生成赛道正在经历从技术驱动向生态驱动的根本性转变。对于可灵AI和即梦AI而言,这既是挑战也是机遇——谁能更快地完成从单点技术优势向系统性生态优势的转变,谁就能在下一轮竞争中占据主导地位。

而谷歌这次的发布,无疑为这种转变提供了无比清晰的路线图。

举报

  • 相关推荐
  • USD1上线引爆市场,HTX下一步瞄准WLFI?

    HTX交易所于5月6日全球首发上线稳定币USD1,成为首家支持该资产交易的平台。USD1锚定美元1:1,由BitGo托管并定期审计,流通市值已突破21亿美元。HTX同步推出USD1/USDT现货交易免手续费活动。平台下一步或将上线WLFI项目,该项目此前已完成5500万美元融资,获孙宇晨等知名投资人支持。HTX以高效运营著称,此前成功上线TRUMP等热门资产,展现精准把握市场热点的能力。孙宇晨在社交媒体暗示WLFI即将登陆HTX,进一步强化市场预期。

  • 即梦总算赢了一次豆包

    进入5月份以来,字节进一步加大了对旗下视频生成应用即梦AI的重视程度。直观表现之一是,即梦AI在苹果中国区App Store免费应用下载榜上排名急速上升。 从5月13日开始,即梦AI已经超越字节旗下豆包和红果短剧两大常年霸榜前二的应用,首次登顶。

  • 快手正式成立可灵AI事业部 可灵AI半年收入破亿

    快科技4月30日消息,快手宣布正式成立可灵AI事业部,负责可灵、可图等系列大模型业务。根据快手的组织架构调整公告,可灵AI事业部为公司一级部门,下设成立可灵AI产品部、运营部和技术部。据悉,快手高级副总裁盖坤将担任可灵AI事业部负责人,继续兼任社区科学线负责人,向快手科技创始人兼CEO程一笑汇报。2023年,快手启动AI战略,研发多模态大模型。而除了视频大模型可灵,快手还发布过1750亿参数规模的通用大语言模型快意”和文生图大模型可图”。在2025年3月25日的快手财报电话会上,快手CEO程一笑称:目前可灵AI图生视频功能的综合效

  • 山东淄博五一开放齐国主题街区:一步穿越到齐国 见齐桓公、管仲等NPC

    快科技5月2日消息,文旅淄博发文称,首个沉浸式齐风市井生活主题街区海岱好市”,在海岱楼钟书阁五一正式开放。在这里,建筑、软装、人物、故事、音乐、器物等方面全方位还原齐国文化,游客可以一步穿越到齐国。街区内,古色古香的建筑、身着齐服的NPC以及精彩的沉浸演艺,将齐桓公、管仲等历史人物一一重现。通过沉浸式剧情游戏,齐国历史也在游客们的探索中徐徐展现,让游客们在游玩的同时,感受到了传统文化的魅力。海岱好市”市集也以复原齐国风韵为核心,融合淄博文化、陶琉丝体验、市集游乐等元素,打造本地首家沉浸式古风市集。为?

  • iPhone 17迈出关键性一步:苹果已完成工程验证测试

    据供应链消息,iPhone 17系列至少有一款机型已完成工程验证测试(EVT),这是苹果产品开发的关键阶段。EVT阶段需修正设计问题并进行功能测试,后续还将经历设计验证测试(DVT)和生产验证测试(PVT)两大阶段,预计9月发布。分析师郭明錤透露,iPhone 17 Air/Pro系列将标配12GB内存,但标准版内存规格(8GB或12GB)需5月才能最终确定。芯片方面,标准版搭载A19芯片,Pro系列采用A19 Pro芯片,均基于台积电3nm工艺,支持Apple智能技术。

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 618战火重燃,谁能给商家确定性?

    这届618刚开始,电商平台已经有火药味儿了。 就在这几天,小红书宣布和天猫打通,为天猫商家在618期间进行引流;天猫和京东同时宣布发放千元大额消费券及各类红包,抢夺消费者的注意力。就连即时零售玩家也纷纷加入618战局,美团和饿了么开始比价,淘宝和京东也拼起闪购。 这些大动作使得电商行业在2025年有了更多新变量,在这场注定内卷的618战役里,更考验平台如�

  • 来京东先人一步下单OPPO Reno14系列 享现货优先发货还赠4年电池保

    5月15日OPPO将发布Reno14系列新机,京东推出"先人一步加速换新计划":1)提供现货优先发货;2)限量赠京东4年电池保;3)预购可选赠品四选一(人鱼奇遇礼盒/蓝牙耳机/《全职高手》礼盒/两年碎屏保);4)参与预购可解锁宋雨琦专属福利(AI明星合拍/电子签名照等)。活动期间还可享至高立减50元、以旧换新补贴1100元、24期免息等优惠。消费者即日起可至京东APP搜索"OPPO先人一步"预约新机,5月13日晚8点起参与京东心动购物季活动,购机可叠加国家补贴和以旧换新补贴,最低4折换新机。

  • 从全网群嘲到刷屏模仿,猫爷的“魔性猫”,为何让人欲罢不能?

    近日,抖音创作者@猫爷 凭借独特的 “原地猫步” 与标志性口头禅 “毋庸置疑”,在短短一个月内狂揽190万+粉丝,短视频播放量更是破亿,掀起全网模仿热潮。 翻看@猫爷 的视频,我们会看到西装革履的@猫爷 穿梭在两排女学员之间,示范女模猫步。 随着紧凑的BGM响起,猫爷自信地扭动身姿,收尾时优雅微笑,性别与职业的强烈反差,瞬间抓住观众眼球。这种极具争议性的

  • 一文盘点20+主流短剧平台,谁会成为下一个红果?

    短剧下半场,一场终极乱战即将打响。 在国内,据QuestMobile统计,截至2025年3月,红果月活用户超1.73亿,与老牌长视频平台优酷仅相差1200万。在海外,据