一览科技罗江春解读Sora技术：内容产业如何搭乘AI快车？

2024-04-07 15:36 · 稿源：站长之家用户

在AI技术不断推动社会进步的今天，内容产业正站在一个新的历史起点上。一览科技创始人、CEO罗江春在近期关于Sora的讨论中，为我们揭示了Sora等视频生成模型对行业的潜在影响。罗江春深入分析了Sora的技术特点，强调了其在视频场景模拟中的重要性，并预测了AI技术将如何逐步改变内容产业的生态。他同时指出，尽管国内在AI领域取得了一定的进展，但与国际领先企业相比，仍存在不小的差距。为此，他呼吁国内企业和创业者应加大研发投入，以实现技术上的突破和产业上的领先。

春节期间，OpenAI又放大招，旗下视频生成模型Sora连登热搜。在文生视频的浪潮下，大众关心的话题也从科技的发展延伸到了自身，AI会抢走哪些人的工作?还有哪些新职业会因此出现?

在此背景下，2月24日，一览科技创始人、CEO罗江春受邀做客南方都市报直播间，与硅基智能创始人、董事长、CEO司马华鹏，浙江大学计算机科学与技术学院副教授金小刚，一同就Sora冲击波可能造成哪些影响，中外大模型产品的差距是否拉大，文生图领域面临的职业新机遇和新挑战等问题进行了一场精彩交流。

议题一:在OpenAI出具的技术报告中，将Sora称为“世界模拟器”。OpenAI认为，视频生成模型是构建通用物理世界模拟器的一条有前景的道路，怎么理解这个说法?

金小刚:Sora并不足以称之为“世界模拟器”。Sora本质上是一个用数据喂出来的产品，用自回归的方式获得的统计意义上的结果，是 ‘大数据、大模型、大算力’的暴力计算得出的。这样的大模型不可能真正理解真实的世界。因为统计归纳方法本身是有很大缺点的。真实世界的复杂性远远高于模型的复杂性，用现有的知识归纳出来的东西，是远远不足以对付复杂世界的。所以这个‘世界模型’的说法显然是有问题的。

罗江春:这个事情我可能有点不同的观点，我一直在做视频，在视频行业待了20多年。首先Sora提出的“世界模拟器”核心指的是如何在视频场景里模拟真实的世界，它并没有超出Video这个领域。其他大模型生成视频，是通过一秒钟24张图片连贯播放做到的，但是Sora发布的视频有镜头概念。我认为它的核心是建了一个虚拟的视频素材的世界模型，然后用这里面的东西去推导，比如高速的转弯，小狗往前跑怎么转换场景，它模拟的狗的眼睛也好，人的眼睛也好，视觉摄像头也好，怎么来进行事物的转换。从这个角度来说，我觉得Sora的技术还是挺令人震撼的，我很期待能用它的产品。

司马华鹏:我认为Sora呈现的视频应该是达到了“世界模型”的程度，从各个角度来看，它的一致性，它的仿真，对物理、流体力学等定律的遵守，包括镜头的切换等都是非常好的。所以它一定是一个世界模型，而且这个世界模型是目前所有的公司和组织都难以望其项背的，当然也是我们奋起直追的目标。

议题二:在视频生成模型领域，国内也有多家企业布局。怎么看待国内企业和国际头部企业的差距?

罗江春:其实一览从成立之初就一直在尝试将AI技术跟视频相结合，2018年我们提到一个概念叫RGC（Robotic General Content），其实跟今天的AIGC(Artificial Intelligence Generated Content)是一个意思，唯一的差别在于2018年我们在做RGC的时候底层是没有大模型的，那时候脚本我们得自己写。文生视频要怎么实现呢?一定要还原三个最关键的环节，分别是脚本、素材和剪辑。脚本包括创意、情节和场景，这些都需要通过大模型描述清楚，而且要拆成镜头;接着通过这些镜头，进行画图、建模，形成素材;第三步则是根据素材库进行后期剪辑、特效。而这些应该是可以在Sora整个模型里完成的，它肯定不是用的图片，肯定有镜头才会看起来这么真实，这后面实际上算力的使用是很庞大的。

回过头来回答主持人这个问题，其实目前从技术上说国内外的差距是在拉大的。之前ChatGPT刚出来的时候很多国内公司说很快就能赶上3.5，结果OpenAI很快就推出了4.0、GPTs、再到现在的Sora。就感觉好像人家研究一天，我们又搞了一年，速度完全跟不上。关键还得有天才的团队、天才的idea以及有大量的资金投入，实实在在去做才会有一个像样的东西来。我是学AI出身的，1997-2000年在美国莱斯大学计算机系读Artificial Intelligence。我觉得面对（国内外）差距越拉越大，我们得奋起直追，需要不计成本、不计代价，要不然的话又会像芯片一样被人卡住。

司马华鹏:在正视差距的同时，我们也要有追赶的信心。事实上，我们硅基智能在海外的团队也在追踪这件事，大家都在不断地探索这块的原理和对应的实现方法。如果国内大厂、很多创业公司都参与的话，我觉得在半年里也应该会有一些能达到他们大概七八成的产品出来。硅基智能在数字人领域深耕了六年，在这一细分赛道上硅基智能已经领先很多国外同行，我们肯定要正视差距，只要有一线的机会我们都会去做。我们也都在各自领域找到了一些弯道超车的赛道在做。

议题三:随着以Sora为代表的视频生成模型的成熟、广泛应用，未来有哪些行业会受到深刻的影响?

罗江春:这个我想用克莱顿·克里斯坦森的《创新者的窘境》理论，就是一个革命性的新技术出现的时候，先被取代的是不被注意的低端产品。在内容产业，图文肯定会最先被颠覆，随后是短视频、短剧，接下来则是影视行业。我相信很快就会有AI驱动的影视剧公司出现了。一到三年之内，出现一个纯AI的爆款电影，这是有可能的。没有明星，没有导演，就是一帮人想了一个idea，拍摄方式完全就颠覆了。这对于影视剧公司来说肯定会面临很大的挑战，挑战的分水岭在哪里呢?就是第一部AI电影，而且是爆款。

现在这个趋势其实已经很明显了。已经有很多创作者在使用一览科技的AIGC全域工作流生产大量的图文，很多时候你在头条上看到的文章，都不知道是人写的还是AI写的，很难判断。然后侵蚀到短视频、短剧、影视剧。我觉得它会从低端到高端，逐渐重塑整个产业。

司马华鹏:影视企业必然会受到冲击，传统的内容平台也会被颠覆。另外，能源和芯片行业肯定也会受到巨大影响，因为Sora可能会吞噬掉世界上九成以上的显卡，这是很可怕的，大家表面上看到冲击的是这些视频生成所影响的产业，但如果它生成的视频大规模地充斥世界，它背后所能够聚拢的显卡资源会越来越多。今天在所有的创业公司里，训练大模型对应的显卡的资源已经是非常的不均衡分布了。

AI竞争的背后，本质上是显卡的竞争，算力的竞争，芯片的竞争。目前在前端的算法上，国内企业可能半年到一年就能追上，但在算力上的追赶是很难的，当你达到同等的效果的时候，对方的市场规模，以及对方在市场上的品牌认知、用户量都锁死之后，再追上是非常难的了。我们最终会因为没有芯片可用，没有这样的算力可用而输掉竞争。

罗江春:我回应一下司马总说的芯片这个事，其实我是很悲观的，为什么呢?就是我们能追上它的效果，但是当追上的时候，它已经虹吸了很多的内容创作者、资金、算力在它的平台上，只可能在局部的demo可能做的差不多，但是实际的Production这个level上我们其实是越差越远的，而且是越追越难。更何况OpenAI手上到底还有多少张牌，我们其实尚未可知。

议题四:哪些工作可能会因为视频生成模型的出现而消失?又可能会出现哪些新职业?

金小刚:这类工具对于普通公众来说会带来巨大的信息和能力的不对称性，如果用于诈骗，将带来不可估量的影响，所以在科技探索的同时，在监管上需要跟上。从教育的角度来思考，我们的教育不能满足于对于已有知识的背诵与综合，要着眼于好奇心的培养，激发学生对于未知的探索。教育不是去培养一个跟ChatGPT竞争的人，而是培养打造ChatGPT的人，根本上来说要培养创新者。

罗江春:可能每个行业都会受到冲击，但速度有所区别。设计师我想还是依然会存在的，因为他有审美，AI会让他的效率提升，我们现在在绘图产品上加了很多功能，包括怎么扩展、擦除、局部修改，都是为了设计师去做的。导演可能也还是需要的，因为他有很多镜头、转场的技巧，基本的审美。但是可能不需要在某个方面特别专业的人才，因为越专业的工作，越能用程序描述清楚的东西，硅基超越碳基是越有机会的。如果是一些要发挥创造力、想象力的工作，这些职业改变应该会慢一点。

司马华鹏:AI对于所有的产业而言，都能带来非常大的进步。今天有非常多的科学发现，都已经开始借助AI在做了。科学发展到这个阶段，有一些焦虑和忧虑很正常，当然我们也要奋起直追。

稿件整理自南方都市报报道

原标题:Sora制造AI焦虑?或引发内容行业变革，算力、芯片之争

采写:南都、N视频记者汪陈晨林文琪

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐抵制过AI的好莱坞能接受Sora？

AI生成视频模型Sora刚诞生一个月，创建者OpenAI计划将之推向好莱坞，建议将Sora应用到电影制作中。OpenAI一直与洛杉矶多家影视公司和媒体的高管积极沟通。Sora还有很长的路要走。

AI生成视频模型 Sora OpenAI
搭乘AI东风，萤石谱写智能家居行业新篇章

3月31日，以“AI无界萤未来”为主题的2024年萤石春季新品发布会在杭州举行，视频通话摄像机S10、TAMO移动看护摄像机、超级夜景室外云台H8x系列、AI三摄全自动人脸视频锁DL60FVXPRO、AI双摄全自动人脸视频锁DL50FVX、家庭助理机器人RK3等多款新品重磅发布，不仅为发布会带来诸多亮点，也为居家智能生活注入更多科技温度与人文关怀。多项新技术的突破彰显了定位于“智慧生活守�

AI技术智能摄像机智能生活
荐AI日报：Awaker 1.0写真视频击败Sora？Sora视频被指大量后期；苹果首款AI平板曝光；百万网友围观博主和AI“谈恋爱”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/1、写真视频击败Sora？Meta也展示了营收增长，但净利润下降，计划增加对AI的支出。

Awaker1.0
荐AI日报：音乐圈巨震!Sora发布首支MV；百度推出AI视频模型；抖音提醒清明节慎用“AI复活”技术；PS2风格AI滤镜风靡网络

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

Sora
易能时代40kW直流快充模块，以EN5拓扑技术助推产业升级

经过数年潜心研究与打磨，业界期待的启明40Pro40kW高效率直流快充模块终于面市，成功释放其在新能源领域的巨量价值。作为易能时代自主研发的旗舰产品，启明40Pro拥有EN5拓补技术、最高达97.5%高转换效率、36°C低温运行、高功率平稳演进四大独创技术，具备转换效率高、产品性能卓越、成本优势明显等众多特性，是集软硬件于一体的高性能产品。相信启明40Pro将会给充电行业

启明40Pro 高效率直流快充模块新能源领域
荐PR+AI重新定义视频剪辑，Sora、Pika全接入，AI视频创企还有的玩吗？

还记得网友们用PS的GenerativeFill花式整活的盛况吗?接下来，被网友玩坏的可能要轮到PR了。无论你是专业的视频剪辑师是业余爱好者，对PremierePro这款软件都一定不陌生。通过引入生成式AI技术，提供一站式的解决方案，不仅有利于大大提高创意工作流程的效率可以让非专业视频剪辑师也能轻松上手PR，进一步扩大Adobe的潜在市场。

AI视频
荐剑指Sora！120秒超长AI视频模型免费开玩

近日，PicsartAIResarch等团队联合发布了StreamingT2V，可以生成长达1200帧、时长为2分钟的视频，一举超越Sora。作为开源世界的强大组件，StreamingT2V可以无缝兼容SVD和animatediff等模型。也许未来的某一天，那里也会是我们人类的生存空间。

Sora AI视频
旷视科技入选北京市通用（AI）人工智能产业创新伙伴计划

为抢抓通用人工智能产业发展新机遇，推动大模型技术创新应用，北京市经信局联合市科委中关村管委会、市发改委共同启动“北京市通用人工智能产业创新伙伴计划”。在7月2日举办的2023全球数字经济大会人工智能高峰论坛上，北京市经信局公布了最新的伙伴名单，旷视获选“模型伙伴”。作为“伙伴计划”的模型伙伴，旷视将充分发挥自身优势，与合作伙伴携手推动大模型技术的创新和应用落地，助力北京市通用人工智能产业的发展。

人工智能北京市通用人工智能产业
荐号称字节版“Sora”的Dreamina，能有几分像Sora?

AI复活又整出新活了。知乎联合两位答主根据灭绝动物的手绘画或照片，用AI还原了它们生前的状态，视频共计还原了13种已经灭绝的动物。随着AI技术的不断进步和产品的迭代更新，我们期待Dreamina未来能为用户提供更完善的创作体验。

Dreamina
交博会更进“翌”步，擎翌智能驶入“快车道”

4月10日，第十四届中国国际道路交通安全产品博览会暨公安交警警用装备展于福建厦门胜利开幕。国内领先的智能交通解决方案提供商——擎翌智能科技有限公司携多项自主研发的交通科技创新成果震撼亮相交博会现场。着眼于未来，擎翌智能将持续推进云边融合与智能分析技术的协同发展，致力于构建全域覆盖、智能高效的交通管理体系，以及更加安全、便捷的城市出行环境。

智能交通解决方案交通科技创新大模型算法

Chat UI:开源代码库，为HuggingChat应用提供动力

chat-ui是一个开源的聊天界面，使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序，为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例，支持多种语言模型和功能，如Web搜索、自定义模型等。

开源聊天应用 SvelteKit

360AI浏览器APP:360AI 浏览器，AI 赋能，秒懂一切。

360AI 浏览器利用人工智能技术，提供智能搜索、PDF、视频、网页总结等功能，旨在帮助用户高效获取知识，提升阅读体验。

智能搜索 PDF 阅读视频播放

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

一览科技罗江春解读Sora技术：内容产业如何搭乘AI快车？

今日大家都在搜的词：

热文

站长商机