首页 > 业界 > 关键词  > 文章搜索最新资讯  > 正文

Sora App的AI视频社交,给了百度们新希望

2025-10-24 15:11 · 稿源: 解码NewSight公众号

声明:本文来自于微信公众号 解码NewSight,作者:袁喜乐,授权站长之家转载发布。

Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。

两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。

奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。

这无疑是扔在AI视频生成领域的一颗重磅炸弹,它揭示了另一种可能,按照OpenAI的逻辑,通过Cameo(客串)、Remix(二创)和社交化产品设计这三大支柱,足以彻底重构内容创作的商业逻辑。

这是Google、Meta、TikTok不愿意看到的,却是百度、阿里、360们期待的。百度蒸汽机团队在最近的一次采访中就坦承,Sora2的产品化和社交裂变方面带来了重要启发。

通过Cameo等功能,Sora巧妙地解决了AI+社交的难题,将重点放在熟人关系的低成本Remix共创上,而非单纯追求视频质量。更重要的是,大模型厂商之间的竞争也从过往简单的模型SOAT比拼升级至产品落地、商业变现等价值维度层面。

这意味着,定义应用与产品能力的重要性正变得与构建模型同样重要。而在大洋彼岸,这也是Sora的同类型产品正在寻求的一条出路。

理性看待Sora2的进步

Sora2的技术有多厉害,看发布后快手和百度的态度就知道了:前者号称AI团队假期8天无休,后者副总裁出面接受采访,直言“50多天高强度推进工作”,还不忘替公司美言——“国庆中秋期间属于合法加班”。

相较早期Sora文生视频模型,Sora2的核心升级主要体现在生成质量和交互能力上:

1)物理一致性显著优化,对刚体、流体、遮挡及碰撞等动力学建模更为精确;

2)可控性增强,镜头运动与叙事节奏能更好响应用户脚本指令;

3)新增原生音频功能,可实现对白与环境音同步生成;

4)画面风格覆盖写实、电影、动画等多类型场景,整体表现更稳定。

在先前基础上,Sora2实现以往视频模型难及的功能(更精准物理效果、清晰真实感、同步音频、强可控性、广风格范围),能精准遵指令创作兼具想象力与真实动态的视频,既拓展叙事和创意表达工具库,也向精准模拟物理世界复杂性的模型迈进。

总之,Sora2是一个更具攻击性的迭代,修复了此前的短板再一次领先行业。但在视频质量层面,Sora2也并非绝对领先。

华泰证券不久前通过在相同prompt下做对比测试,发现可灵与即梦的视频生成质量整体仍优于Sora2,其中可灵2.5Turbo已登顶Artificial Analysis文生视频榜首。

图片

百度的蒸汽机AI视频模型不仅是全球首个实现中文音视频一体化的视频生成模型,最新的版本还瞄着Sora2打——用户可支持无限时长视频生成,并能在生成过程中实时交互,随时改写内容或扩写续集。

换句话说,在技术层面Sora2几乎没有断代领先优势,但在模式上这一次却是一骑绝尘。

Sora App上线第四天拿下美区App Store免费应用榜第一名,超越OpenAI的ChatGPT和谷歌的Gemini。目前,Sora仍处于邀请制测试阶段,仅在美国和加拿大地区的iOS设备上提供。尽管存在这些限制,Sora仍然登顶苹果美服应用排行榜。

图片

据应用情报提供商Appfigures的数据,在仅限美国和加拿大地区并采用邀请制的情况下,Sora的iOS应用程序于9月30日和10月1日上线后的头两天内,总计获得了16.4万次下载。

从首日下载量来看,Sora尽管不及ChatGPT,但已经和xAI推出的Grok持平,不过考虑到Sora并未全面开放,其市场潜力可能更为巨大。

这也是为何在发布最初的几天后,山姆奥特曼的蹦迪视频迅速在短视频平台消失,Sora APP本质上是OpenAI从“单一对话工具”(ChatGPT)向“生态化社交平台”的核心战略转型。

更直白一点就是,Sora APP本就是来抢短视频饭碗的,它大概率是下一代的短视频平台。

媒体和券商也将客串(Cameos)和混剪(Remix)视为两大革命性功能,认为Sora2不是简单的视频生成创造工具,而是AI时代的TikTok。

客串(Cameos):用户只需在应用内进行一次性的简短音视频录制,以验证身份并捕捉你的形象,Sora2模型就能以惊人的保真度将用户上传的形象复刻。之后,用户进行形象授权,将用户的虚拟形象置入任何AI场景中,创建带有用户个人形象的“客串视频”。

混剪(Remix):内置的剪辑工具,只允许用户输入提示词,对平台上的任何视频和潮流进行「二创」,生成属于用户自己的版本。

更重要的是,这一布局并非简单的功能延伸,而是针对AI产品增长逻辑的深层优化,标志着OpenAI从“AI工具提供商”向“AI生态构建者”的转变:

通过Sora APP串联起“模型能力→用户场景→商业变现”的完整链路,既避免了因单一工具属性导致的增长乏力,更以“数据飞轮+社交网络”的双重护城河,巩固了在AI生成式内容领域的领先地位。

AI视频社交,想掀短视频的桌

Sora App自10月4日起持续位居iOS免费榜首的原因,有人总结主要源于三点:

1)UGC玩法丰富。通过Cameo好友入境与Remix二创功能,用户可生成沉浸式互动视频,与好友或名人(如Altman)同框,AI亦使得偏离现实的创意剧情成为可能,兼具趣味性与社交属性。

2)邀请制机制推动社交裂变。Sora采用邀请码制,新用户输入邀请码即可体验,每位新用户又可邀请4位好友参与,既保证了种子用户与目标群体的一致性,也通过稀缺感提升了产品的心理价值。

3)ChatGPT在C端拥有深厚用户基础。ChatGPT网页端与移动端9月 MAU 已分别达到7.9亿(Similarweb)与2.7亿(SensorTower),稳居大语言模型首位,流量基石稳固,同时,Sora网页版与ChatGPT会员捆绑销售,可促进用户导流。

而这种策略后续极有可能会被国内本土化AI视频跟进,尤其是那些具备技术但无社交的产品,比如百度、360、阿里等。毕竟国内产品更强调视频内容创作,类似Cameo与Remix的互动玩法尚未落地,C端社区文化仍处于早期阶段。

对于字节、快手来说,在国内推出一个独立于主平台的AI视频App也并非不可能,毕竟也有导流。

Sora App虽然在国内构不成威胁,但在海外市场仍有杀伤力。Sora App之所被称为 “AI版TikTok”,正是因为界面及首页推荐逻辑与之相似——App主页为垂直视频流,用户可上下滑动浏览其他用户发布的内容。

图片

但这还不是最关键的,OpenAI正在急速构建一个围绕视频生成的、由IP驱动的新生态系统。

其核心就两点:“ granular control(精细化控制)” 和 “ revenue share(收入分成)”。这意味着,Sora将不再是简单的工具,而是一个连接IP方与全球亿万创作者的经济平台。

所谓精细化控制,是指OpenAI将为版权方提供更细粒度的控制权,允许他们对角色生成进行更精确的管理,类似于“肖像同意”模型,但将加入更多控制选项。

而收入分成则表示,OpenAI计划尝试将一部分收入分享给那些希望用户生成自己角色的版权方。

由此一来,Sora有望由APP平台主导,形成“IP+创作者”的收入分成商业模型。

对IP方(好莱坞、游戏大厂、日漫出版社)来说,沉睡的IP资产库变成了可24小时开采的“油井”。不仅可以坐收授权费,更能借助全球创作者的脑洞,维持IP热度和生命力,甚至通过数据反馈(哪个角色、哪种风格最火)指导后续创作。

对创作者而言,终于可以合法、合规、低成本地使用蝙蝠侠、皮卡丘,甚至《三体》中的角色来创作视频。创作从“技术活”变成了“创意活”,核心能力从操作软件变为提示词工程和审美。更重要的是,你的爆款视频将能带来真金白银的平台分成。

尾声

Sora2的社交属性使其从“工具”变成了“平台”,虽然定义应用与产品的能力被提升到了前所未有的高度,但同时也为其同类产品打开了新的思路。

以往,AI视频产品更多投入用在视频生成质量,对于应用则是尽可能指向B端的广告、教育、自媒体等少数行业,至于C端则很少涉猎。

但在Sora App之后,形势可能会有所改观。

一方面,国内各家都极力追赶Sora2的技术进度;

另一方面,社交属性的开发令百度等缺乏社交资源的公司嗅到了AI视频的第二种可能。

以及山姆·奥特曼在Sora更新信息之中明确提到的“为创作者提供变现机制”。也就是,Sora补齐编辑功能、增加用户激励机制后,它可能在短时间内为用户找到变现路径,一旦雪球滚大,Sora就有机会成为TikTok一样用户生产、用户消费的闭环平台巨头。

而这恰恰是百度们的希望。

举报

  • 相关推荐
  • Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。

    ​Sora2爆火之后,随之而来的AI视频领域的新产品。 来自我的好朋友,曹越老师的Sand.ai。 凌晨,他们终于上线了他们全新的音画同步视频模型GAGA-1,在人物表演上,我觉得,已经算是现在的TOP级了。

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 狂奔20天,全网“追赶”Sora2

    Sora2的发布,再次搅动了全球人工智能行业的神经。 9月30日,OpenAI正式推出其视频生成模型的重大升级版本——Sora2,以及基于该模型的社交应用Sora App。与前一代相比,Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升,并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”,也让视频生产“像写字”一样简单。 短短五天,Sora App下载量便突破百万�

  • 即梦VS可灵,谁能「对标」Sora2?

    AI视频的战争,才刚刚开始。 在生成式AI的大航海时代,文字、图像、代码的疆界已相继被重绘,唯独“视频”这一最复杂、最昂贵、最具传播势能的内容形态,始终处在被技术反复叩门却未彻底攻陷的高地。 这个局面,似乎终于要被OpenAI在10月1日推出的Sora2而改变。

  • 什么样的内容最容易被AI引用?GEO(生成引擎优化)时代的核心命题

    随着AI问答时代到来,用户从“搜索”转向直接向AI“提问”,生成引擎优化(GEO)应运而生。文章指出,易被AI引用的内容需具备权威性、准确性、结构清晰且被广泛认可,并介绍了AIBase的GEO排名查询工具。该工具支持多平台检测,通过模拟真实用户提问,提供品牌在AI回答中的曝光度、排名等数据分析及优化建议,帮助品牌提升AI可见度,抢占智能问答时代先机。

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • GEO是什么?AI 搜索引擎优化该怎么做?一篇文章帮你搞懂

    在AI驱动搜索的新时代,传统SEO已不再是唯一战场。文章提出GEO(生成式引擎优化)策略,核心是让品牌信息出现在AI助手的回答中,比传统搜索排名更重要。GEO通过品牌识别优化、内容适配重构、引用源建设和对话式体验设计四大模块,提升AI回答的准确性和引用频率。建议结合SEO与GEO双轮驱动,并利用AIBase等工具监测优化效果,抢占AI搜索流量入口。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 生成式 AI 搜索优化(GEO)完全指南:从入门到落地

    随着生成式AI工具普及,用户更倾向直接提问而非传统搜索,导致优质内容可能被AI忽略。本文介绍生成式引擎优化(GEO)策略,帮助内容被AI理解、引用并整合进答案。核心包括:优化内容结构(如摘要、问答块、列表)、使用Schema标记、构建权威性,并推荐AIBase等工具监控引用效果。GEO是SEO的演进,需重塑写作方式以适应AI阅读逻辑。

  • 最新版国内直连Sora2,无水印免费使用教程

    OpenAI推出的Sora2视频生成模型引发全球关注,其文字理解能力显著提升,仅需输入提示词即可生成带原生配音的完整视频,覆盖短视频、广告、影视等多场景。然而官方渠道存在水印且需付费,国内用户难以体验。文章推荐通过浏览器插件DeepSider免费使用Sora2,支持中文注册、无限制登录,可控制画面比例、无水印保存。该插件还集成Claude、Gemini等数十款AI模型,具备文档解析�

今日大家都在搜的词: