首页 > 业界 > 关键词  > 视频生成模型最新资讯  > 正文

即梦和可灵,能不能接住AI短剧风口?

2026-06-05 09:48 · 稿源: 新莓公众号

声明:本文来自于微信公众号 新莓,作者:何聆筝,授权站长之家转载发布。

AI生成视频,冰火两重天。

一边是曾经炸场的Sora关停,一边是国内即梦、可灵用户与收入飞涨,以及阿里旗下新面孔Happy Horse1.0模型的涌现,引起新的狂欢。

这种强烈反差的直接原因,当然在于用户需要替代方案。

在多家海外科技媒体发布的Sora 迁移指南中,即梦、可灵与Google Veo3.1、Runway Gen-4.5等被列为主要替代方案。

Sensor Tower数据显示,Sora宣布关停后一周,可灵全球周活跃用户环比增长4%,达260万。而即梦一季度月活则达到1352.5万,下载量558.9万,稳居视频生成赛道首位。

更深层次的原因是,AI生成视频产品迎来了历史性机遇——AI短剧的爆发,是最理想的应用土壤。2025年国内AI漫剧市场规模已达168亿元,2026年预计将突破240亿元。支撑这些想象空间的,就是AI视频模型。

然而,用户与收入的增长,只是故事的开篇。当技术惊艳全球之后,一个更现实、也更残酷的问题摆在面前:如何将流量与声量,转化为一条清晰、可持续的盈利路径?

Sora的退场已经证明,在算力成本高企的AI视频赛道,商业的成功远比技术的领先更为艰难。

AI音乐 人工智能 (3)

撞上AI短剧风口

今年一季度,即梦AI月活达到1352.5万,下载量558.9万。业内保守估算,春节期间Seedance2.0的月活一度突破4500万。

这个数字不仅超越了Sora巅峰时的600万月活,也超越了可灵。一季度,可灵月均下载量56.2万,月活119.1万,3月移动端平均月活780万。

即梦之所以在用户数量上领先,离不开字节生态的流量加持——接入豆包,登陆CapCut「剪映海外版」,承接抖音流量和内容消费场景。

Seedance2.0的上线,为即梦创造了新的增长点。低门槛创作加免费赠送积分策略,几乎是零成本撬动了大众的AI创作欲。

刷屏全网的「酱板鸭与狐狸」正是即梦创造的现象级案例——一个贵州酱板鸭品牌团队用即梦Seedance2.0,仅用了5小时、40元成本,生成一段邵氏武侠风的荒诞短剧,最终引爆全网,衍生出全民二创的「酱板鸭宇宙」。

与之相比,可灵的用户基数更小,但用户付费意愿更强,主要是以自媒体视频创作者和广告营销从业者为主的P端付费订阅会员。

快手CEO程一笑去年曾对外表示,P端付费订阅会员贡献了可灵AI将近70%的营业收入,他们兼具C端用户的传播属性和B端用户的付费能力,是目前视频生成大模型的核心受众群体。

在影视前期,可灵的智能分镜和主体参考技术,可以帮助创作者把需要大量沟通的创意验证过程,变成精确可调的具象化过程。而在广告制作领域,可灵被大量用于生成不同情境的广告Demo。

编剧杨选认为可灵3.0的多主体参考和音画同出功能,来高效生成完整的剧情片段,可以大幅简化从分镜到成片的工作流。

如果考虑到较强的电影质感,可灵常被运用于专业的影视工业链条。比如开年大剧《太平年》和亚马逊热播剧《大卫王朝》的制作,正是由可灵承担部分虚拟场景与特效镜头的制作。在前期,制作团队还大量使用可灵的图片模型来生成和筛选场景概念图与角色设定稿。

时光坐标创始人陈奕在谈及《太平年》的AI应用时,评价「可灵在光影和材质的细节表达上,能过得了专业视觉艺术家的眼睛」。

即梦也在加强在专业领域的运用。热剧《万兽独尊》使用的正是搭载Seedance2.0的「小云雀AI短剧Agent」全流程制作。

即梦还参与了今年春晚《贺花神》《快乐小马》《驭风歌》等节目的视觉定制。火山引擎总裁谭待此前还透露,春晚其实是Seedance2.0正式推出前的第一个商业客户。

这些成为AI剧风口来临时,即梦和可灵能快速承接需求的重要基础。

2026年,字节漫剧的日token消耗已突破7000万元,首次超过真人短剧。多镜头叙事、专业级参考控制能力让它成为不少短剧制作团队的标配。

从生成画面到理解故事

AI视频模型的成熟,为影视行业带来的首要变革是,可以短时间完成一部作品。

以AI短剧为例,一年前,单集制作交付周期一般在5-7天。精品剧集可能7-10天,或者更长。现在,这个时间正在被急剧压缩。

今年年后出圈的《霍去病》和《万兽独尊》,前者从筹备到完成约4天,核心团队仅3人,后者使用字节的全流程AI短剧制作工具,5个人8天做出了60集内容。

包括清明节刷屏的AI短片《纸手机》,使用可灵3.0Omni模型,仅用3天时间就完成了从创意构思到成片输出的全过程。

这又反向促进了AI短剧的繁荣,背后是模型的可用率与可控性的根本性提升。即梦Seedance2.0和可灵3.0的先后发布,算是一个转折点。

Seedance2.0最具革命性的突破,在于「全能引用模式」。即允许用户在单次生成中,自由混合并精确引用最多9张图片、3段视频和3段音频作为多模态参考素材,创作者可以先借助图片模型快速敲定角色设定与场景概念图,再将定稿画面导入视频模型,作为强约束视觉参考。最终,在单次生成中将角色、动作、音效等复杂元素一次性精准融合。

至于控制能力,可灵3.0提供了另一条路径,通过「All-in-One」全流程整合体系与「主体库」模式,用户只需输入一段剧情提示词,模型便能自动拆解出包含不同景别和镜头运动的多个分镜,预先产出高质量、高一致性的视觉分镜稿,并在15秒镜头中保持主体外观、姿态的一致性。

「声画同出」能力的成熟,是效率提升的另一关键。

所谓「声画同出」,指的是模型能一次性生成音效、口型、音乐与画面高度同步的完整段落,声音能随剧情节奏起伏,这意味着模型需要理解「叙事」,甚至达到「开箱即用」的水准。

国内最早商用该功能的是阿里通义万相Wan2.5,但率先靠此破圈的却是即梦Seedance2.0。

控制能力的飞跃,带来的是抽卡随机性骤降。

以前使用AI制作一段视频,仅一段分镜往往就需要20次以上的抽卡,才能得到合适的几秒钟画面。如果是涉及复杂物理定律的打戏,可能抽卡上百次也难以得到前后连贯的画面。

比如汤臣倍健曾经耗资百万制作了一个纯AI生成的广告片《敢探极境》,两分多钟片长,一百个镜头,每个镜头的图片和视频抽卡数百次。

而现在,抽卡效率大幅提升。漫剧从业者流萤分享,即梦让抽卡效率提高了「至少十倍」,因为「新模型的构图思维提升了非常非常多,有时候甚至一句话就能生成一个基本可用的初版。」

一面是效率提升,另一面则是成本骤降。对于影视行业来讲,这简直是有如神助。

传统真人短剧单集成本5-10万元,单部精品成本50-300万元,而新的AI视频工具,可以让单集成本压至5000元以内,算力成本最低仅千元级,降幅超90%。

比如前文提到的《霍去病》,算力成本仅3000元。而《万兽独尊》这样5人8天完成60集短剧的案例,直接将传统数月周期压缩至数天。

尽管如此,在满足专业影视级制作的深度和稳定性上,即梦和可灵都还有很大提升空间。

一些创作者认为,即梦目前还做不了长叙事的稳定输出,一旦超过一分钟,短板便开始显现,「对于复杂空间和高密度的情绪沉淀也不太行,面部表情不够细腻,比如微笑表达过于急促或有缺失,还得靠演员来演。」

此外,即梦暂不支持真人人脸参考和IP形象生成,这也在进一步限制了专业团队的使用效率。

Seedance2.0近期还面临排队和「降智」的双重困扰——高峰时段排队时间长达8至10小时;同样的提示词,现在生成的效果与刚发布时相比大打折扣,理解力下降、前后一致性不足。

赚钱如何赶上烧钱?

无论是用户规模与行业声量,即梦和可灵已经稳居国内头部。但技术领先并不等于商业的成功——当推理成本无法被收入覆盖时,再惊艳的技术也无法持续。这是Sora关停带来的前车之鉴。

即梦和可灵需要快速证明,自己不仅能吸引用户,更能创造可持续的利润。

最近一个月,即梦涨价3次。

从3月上调积分消耗数,到上线Seedance2.0VIP会员专属通道,在原有会员基础上叠加付费加速,4月8日继续提价,砍赠送积分。

对即梦而言,C端用户越多,API并发压力越大,但创造的价值却有限。把算力卖给能付得起钱的企业客户,才能构建可持续的商业模式。因此,即梦一边提价,一边开放API——4月2日,火山引擎开放Seedance2.0API公测,4月14日全面上线,企业客户可直接购买批量调用能力。

但即梦的涨价策略并非没有代价。频繁调价直接冲击了用户体验,抱怨声四起。有创作者算了一笔账:即梦月卡会员从299元涨至499元,生成一条10秒素材的价格从0.6元飙升至6.67元,涨幅超10倍。

与此同时,排队时间暴涨,即便是VIP会员在凌晨也需要排队数小时。

涨价本质上是用市场机制筛选用户,让愿意付高价的留下,这种「控流」虽能缓解算力压力,却也在无形中为竞争对手打开了窗口。

比如,4月横空出世的Happy Horse,声称720P视频费用是0.44元/秒,1080P则在0.78元/秒。与此同时,通过阿里云调用Happy Horse API 没有门槛限制。

阿里ATH创新事业部之前对外说,4月底开放测试后,HappyHorse-1.0将于5月份正式发布商用。

与此同时,可灵则采取了降价策略。既为了在Seedance2.0的冲击下守住P端用户,也意在以性价比策略吸纳更多专业用户和潜在付费群体,为B端企业服务的规模化扩张打基础。

只是可灵降价到底是解决问题,还是引发了新的问题,还未可知。

可灵此前能实现规模化盈利,核心是靠高ARPU值的付费用户覆盖算力成本,且用户结构以高价值付费用户为主。靠低价吸引来的用户,不仅付费意愿不高,还会带来极高的API并发压力与算力消耗,推高运营成本。

与字节相比,快手的算力基座并不占优。快手自有公有云基础设施薄弱,AI视频生成又是重资产赛道,算力缺口意味着可灵未来可能更多依赖第三方云服务,其商业化收入将一定程度上以算力账单的形式外流。

如何才能在低价拉新、算力投入与盈利预期之间,为可灵找到一条可持续的发展路径,是摆在快手面前最棘手的命题。

根据快手2025年财报,可灵全年营收为10.4亿元,占总营收的0.73%。快手计划2026年新增110亿开支用于可灵算力支撑。财报披露次日,快手股价大跌14.04%。

可灵对快手的意义,其实早已不止是一个营收单元。它既承担着资本市场的想象,也是为主业创造增量的重要因素。是快手在AI时代的「船票」,因此即便冒着利润承压的风险,也要持续加注。

不过,AI视频赛道的竞争从来不是静态的,技术迭代、资本预期、监管规则、玩家格局的每一次变动,都可能颠覆现有的平衡。

今年OpenClaw的大火就是一个重要的变量。在AI视频领域,未来的创作流程可能不再是人类直接操作视频生成模型,而是由Agent调用一系列专业Skill来完成——从脚本生成、分镜设计、视频生成到后期剪辑,每个环节都可以封装为可被 Agent 调用的标准化能力。

这对即梦和可灵是机遇,也是威胁。

机遇在于,如果它们能将视频生成能力封装为Agent可调用的Skill,就能嵌入更广泛的企业工作流;威胁在于,一旦视频生成变成Agent生态中的一个可替换模块,用户忠诚度将取决于API的性价比和稳定性,而非产品本身的品牌黏性。

AI视频赛道没有永远的赢家,只有无尽的赶考者。

举报

  • 相关推荐
  • sora正式停服,国内版天空AI视频生成模型发布

    Sora宣布停服后,国内“天空AI”视频生成大模型正式发布。该模型由温州专帮信息科技推出,支持文本、图片生成逼真视频,核心亮点是用户无需GPU服务器,用家庭或办公电脑即可完成算力,成本几乎为零。目前发布三个版本:手机版、单机版和多用户商用版,并支持OEM贴牌、私有化部署等技术服务,实现低成本、高效率的视频创作。

  • 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题

    今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。 目前,JoyAI-Echo代码与权重已全部开源,项目页和GitHub代码仓库均已上线,开发者和创作者可进行体验和二次开发。 京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。 据了解,JoyAI-Echo内置跨模态音视频�

  • 男子用AI写歌月入十几万:40秒就能生成一首歌

    近日,浙江杭州一名从业者借助AI音乐创作工具实现可观收益。该创作者只需上传一张图片,耗时40秒便能生成一首完整曲目,工具可驾驭各类曲风,生成作品的人声、唱腔还原度贴近真人演唱,普通听众很难区分演唱者是AI还是真人。 依托低成本批量制作AI歌曲,投放到音乐、短视频平台变现,月收入可达十几万元,AI生成音乐也逐渐在各大内容平台收获流量。 同时他提醒大

  • 从技术叙事走向商业化拐点,AI视频公司集体迎来价值重估?

    刚刚,快手发布2026年一季度财报。比起集团整体表现,市场的注意力更聚焦在可灵AI的经营数据。 财报显示,2026年第一季度,可灵AI营业收入超过人民币6.5亿元,同比增长超300%;2026年3月,其年化收入运行率(ARR)已接近5亿美元,较去年3月的1亿美元增长4倍,其商业化进程进一步加速。 几乎就在同一个时间窗口里,另外两件行业标志性事件同步发生。 一边是戛纳电影节上,

  • 日本熊袭击人清晰视频流出:工人被狂追后扑倒在地

    当地时间6月2日上午,日本福岛钢铁厂的监控视频记录下一头亚洲黑熊袭击人类的过程,当天它先后袭击了工厂两名男性员工、附近住宅的一名80多岁女性,以及另一家公司一名60多岁男性。 监控画面显示,这头黑熊在工厂入口穷追一名20多岁的工人,虽然工人已经绕着圈子闪躲,但最终还是不敌,被黑熊扑倒在地,好在有人驾驶一辆汽车驱赶,这才将黑熊给吓退,否则后果怕�

  • 闯视频赛道,小红书动真格了

    5月26日晚,杭州太阳剧场的颁奖台上,一位英国教授的名字出现在大屏幕上。 他叫Alan Macfarlane,已经84岁,是剑桥大学社会人类学系荣休教授,研究领域横跨英国巫术史、尼泊尔社会、现代世界起源。他参赛的视频毫不“流量向”,没有三分钟抓人眼球的叙事,没有精心设计的剪辑节奏,开头只是用略带口音的中文道一句“你好”,然后娓娓讲述关于文明、历史或人类社会的�

  • 2499元!华为AI眼镜发布:第一视角AI闪拍、视频通话

    华为发布AI眼镜方形钛银灰版,售价2499元,主打第一视角拍摄与智能交互。搭载1200万像素超感光摄像头和1/2.8英寸大底传感器,支持4K照片、2K视频及HDR+Vivid标准,0.7秒AI闪拍捕捉瞬间。内置自研AI芯片,支持智能问答、卡游识别及“看一眼支付”。轻触镜腿快捷键可快速操作,钛合金铰链佩戴舒适,IP54防水防尘,12小时综合续航。运行鸿蒙系统,可连接华为设备,外观可选方形、圆形镜框,支持定制近视镜片。6月1日10:08开售,赠换新守护权益和优惠配镜服务。

  • AI视频应用迈入双位数增长期,小影科技居收入下载榜前十

    根据 Sensor Tower 发布的《2026年全球 AI 应用趋势洞察》,2026年第一季度,全球 AI 图像视频生成 App 的内购收入达到1.5亿美元,环比增长20%,下载量达到1.7亿次,环比增长12%,均超双位数。 与 Web 端更重生产力属性不同,移动端的 AI 视频产品,更偏向以模板设计为用户提供娱乐体验,这一商业模式本存疑虑的赛道,从数据看,已经验证市场需求。

  • 微信正与手机厂商合作推出A2A助手:可语音发消息、视频通话

    微信正在与华为、荣耀、小米、OPPO、vivo等手机厂商合作推出A2A(Agent-to-Agent)助手能力,可通过手机语音助理发起微信的音视频通话,或向好友发送消息。 目前,荣耀部分机型已经支持该功能,把YOYO智能体和微信更新到最新版本,即可唤醒YOYO直接语音下达指令,比如语音发微信消息、拨打微信语音、视频通话。 A2A为跨应用智能体通信标准,打破APP生态壁垒,运行逻辑为手�

  • 快手亮相2026金砖产融合作论坛:直播短视频出海赋能金砖合作

    5月28日,2026金砖国家新工业革命伙伴关系系列活动之金砖产融合作论坛在厦门举行。论坛以“深化金砖产融协同,赋能企业国际化发展”为主题,围绕产业合作、企业国际化、技术创新出海等议题展开交流。快手受邀参会,副总裁、快手研究院院长蔡雄山发表题为《直播短视频出海赋能金砖合作》的主旨演讲,分享了快手在技术、商业模式和文化出海方面的实践。快手通过AI技术降低视频创作门槛,助力AIGC在影视、广告等领域落地;在巴西等市场深耕本土化,推动数字平台赋能当地商业生态;并强调文化深度融合,以长期责任服务当地社会发展,助力构建开放、包容、互利共赢的数字经济合作生态。

今日大家都在搜的词: