首页 > 传媒 > 关键词  > 昆仑万维最新资讯  > 正文

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

2025-02-18 11:04 · 稿源: 站长之家用户

2 月 18 日,昆仑万维开源中国头个面向AI短剧创作的视频生成模型SkyReels-V1、中国头个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

开源地址:

1、SkyReels-V1:https://github.com/SkyworkAI/SkyReels-V1

2、SkyReels-A1:https://github.com/SkyworkAI/SkyReels-A1

3、技术报告:https://skyworkai.github.io/skyreels-a1.github.io/report.pdf

4、SkyReels官方地址:skyreels.ai

1. SkyReels-V1:Human-Centric Video Foundation Model,中国头个面向AI短剧创作的开源视频生成模型

SkyReels-V1 可实现影视级人物微表情表演生成,支持 33 种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。正如以下视频所示,SkyReels-V1 支持生成大笑、怒吼、惊讶、哭泣等微表情,展现出人物情感丰沛的表演细节。即使有大幅度肢体动作,SkyReels-V1 生成的微表情也美好贴合人物肢体表演。

同时,SkyReels-V1 为AI视频生成带来了电影级光影美学,基于好莱坞级的高质量影视数据训练,当前SkyReels生成的每一帧画面,在构图、演员站位、相机角度等都具备电影级的质感。无论是单人镜头表演细节,还是多人构图,当前已具备准确的表情控制和高质感画面。

更重要的是,SkyReels-V1 不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最 大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。

图 1 丨SkyReels-V1 文生视频指标对比(来源:昆仑万维SkyReels)

能够实现这样的SOTA级别,不仅依赖于昆仑万维SkyReels团队基于自研的高质量数据清洗和人工标注管线,构建了万级的高质量电影&电视剧&纪录片数据。更依托团队自研「Human-Centric」的视频理解多模态大模型,大幅提升视频中人物相关的理解能力,尤其是自研人物智能解析系统。

综上所述,得益于扎实的数据工作和先进的人物智能解析系统,SkyReels-V1 可以实现:

影视化表情识别体系: 11 种针对影视戏剧中的人物表情理解,如不屑、不耐烦、无助、厌恶等表情的理解;

人物空间位置感知:基于人体三维重建技术,实现对视频中多人的空间相对关系理解,助力模型生成影视级人物站位;

行为意图理解:构建超过 400 种行为语义单元,实现对人物行为的准确理解;

表演场景理解:实现人物-服装-场景-剧情的关联分析。

SkyReels-V1 不仅是全球极少数开源的视频生成模型,还是围绕人物表演、开源视频生成模型中性能最 强的。

在自研推理优化框架「SkyReels-Infer」的加持下,大幅提升推理效率,实现544p分辨率,推理基于单台 4090 只需80s,还支持分布式多卡并行,支持Context Parallel,CFG Parallel,和 VAE Parallel。此外,采取fp8 quantization以及parameter-level offload,满足低显存用户级显卡运行需求;支持flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源diffuser库,提升易用性。

正如下图 2 所示,在同等RTX4090 资源情况下对比( 4 卡),SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s);SkyReels-Infer版本具备更鲁棒的部署策略,支持用户级别显卡 1 卡- 8 卡的推理部署。

图 2 丨推理生成544p视频,使用相同卡数的RTX 4090,SkyReels-Infer版本端到端延迟优于HunyuanVideo官方(xdit) 58.3%

在同等A800 资源情况下对比,SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少14.7%~28.2%(如图 3 所示),SkyReels-Infer版本具备更鲁棒的多卡部署策略。

图 3 丨推理生成544p视频,SkyReels-Infer版本具备更鲁棒的多卡部署策略,支持 8 卡部署

2.SkyReels-A1:头个SOTA级别的基于视频基座模型的表情动作可控算法

为了实现更加准确可控的人物视频生成,昆仑万维还开源了SOTA级别的基于视频基座模型的表情动作可控算法SkyReels-A1,对标Runway的Act-One,SkyReels-A1 支持视频驱动的电影级表情捕捉,实现高保真微表情还原。能够基于任意人体比例(包括肖像、半身及全身构图)生成高度逼真的人物动态视频,其真实感源自对人物表情变化和情绪的准确模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。

SkyReels-A1 不仅支持侧脸的表情控制生成、还能实现更加逼真的眉眼微表情生成和更大幅度的头部与自然身体动作。SkyReels-A1 能够实现更大幅度的人物表情驱动。相比Runway的Act-One,SkyReels-A1 可以迁移更复杂的表情动作,生成的人物面部神情可以配合肢体及画面内容实现更栩栩如生的表演。

3.以开源之姿,以破局之势,昆仑万维致力于推动全球AI短剧创作生态繁荣发展

昆仑万维一直坚持开源,推动技术平权。昆仑万维同时将SOTA级别的SkyReels-V1 和SkyReels-A1 进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。

我们相信在进行推理优化的升级和可控算法的开源后,它们将为用户带来低成本、可控性更强的AIGC能力。昆仑万维希望通过更多优秀视频生成模型的开源和极 致的AI短剧产品能力,为用户带来低成本实现AI短剧创作的可能性、突破行业目前视频生成一致性差的问题,让大众通过自己的电脑生成精细且可控的人物表演。

此次开源的视频大模型,不仅是一次技术突破,有助于缩小全球内容产业的数字鸿沟,更是文化产业生产力的一次革命。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合。AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。

“实现通用人工智能,让每个人更好地塑造和表达自我”是公司的使命,未来,昆仑万维及SkyReels还将开源更多视频生成模型和算法、通用模型,通过开源实现AGI平权,推动AI短剧生态的持续建设和繁荣,促进开源社区、开发生态以及AI行业的发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI短剧,最赚钱的是卖课?

    “想知道AI在什么领域真能赚钱,小红书上检索下‘AIXX’。出来的结果没什么卖课信息,那证明这个AI赛道是赚钱的,大家都在闷声发财。或许硬糖君很快就要开始品评AI小生、小花,想想还有点心情复杂。

  • AI短剧,起风难

    短剧赛道越来越卷,卷着“美学”的同时,技术也没有停歇,AI短剧正在批量化进入市场。抖音九五二七剧场在春节档上线了首部AI动画短剧《无名特工队》;随后,快手星芒短剧拿出了首部AI单元剧集《新世界加载中》先导片;紧接着,红果也拿出了首部工业级AI短剧《玄幻:从拉二胡开始》;风芒也不甘示弱地在近期推出了中国首部AI东北奇幻短剧《兴安岭诡事》……各个平台纷纷

  • AI日报:昆仑万维开源R1V多模态推理模型;豆包AI编程能力上线三大功能;英伟达推DGX个人AI超级计算机

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、昆仑万维开源SkyworkR1V视觉思维链推理模型昆仑万维推出全球首个开源多模态推理模型SkyworkR1V,具有38亿参数,性能接近知名闭源模型DeepSeek-R1。该功能能够快速分析过去48小时内的热点话题,用户反馈积极,显示出Grok在信息处理方面的强大实力。

  • 抖音和即梦AI的新实验:扶持AI短剧,再造「竖屏美学」

    降本成效是AI正在做的事,但不会是它最重要的事。它要开拓的是人类想象力的极限,甚至如果脑洞再大开一点,可以是世间所有生物想象力的极限。正如张楠所言,「其实想象力的局限,永远不是技术的局限是认知的局限。

  • 成本5000块的AI短剧,正在破土!

    AI生成视频,不仅是一场技术的革命,更是一场平权的运动。过去只有掌握资源的少数人才能拍得起电影,但现在AI能让大多数人用白菜价拍出自己的电影。那个未来值得我们满怀期待,因为不管处于多偏远的地方,努力用心的人总会被更多人看见。

  • 周鸿祎AI短剧上线:黄奕伪装刺杀其画面曝光 两人有不少动作戏

    快科技2月25日消息,今日,由360集团董事长周鸿祎出演的首部AI短剧,在万众期待下终于上线了。因为知名影视演员黄奕的加入,该部AI短剧可谓吊足了大家的胃口。在这部AI短剧的片头,由黄奕饰演的机器人一身黑色皮衣上线,随后她伪装刺杀”250集团周总(周鸿祎饰)。在剧情铺开的过程中,黄奕和周鸿祎期间上演了不少对打动作戏。此前,周鸿祎曾在社交账号上谈到与黄�

  • 11集卖5块9 第一批AI短剧已经赚钱了:成功斩获4444.7次播放量

    近日,AI短剧领域迎来了一次重要的革新。由杭州炬核智能科技有限公司制作的AI短剧《兴安岭诡事》在风芒APP、抖音原生端与B站正式上线,迅速引发了行业的广泛关注和热议。这部融合了东北五仙民俗与爱国主义元素的短剧,以其突破性的技术表现和独特的剧情内容,成功吸引了大量观众的眼球。《兴安岭诡事》讲述了猎人彪子奉命携子与外国专家深入兴安岭腹地寻找关东军

  • 阿里深夜开源相2.1,这是AI视频领域的DeepSeek啊。

    昨天的AI新闻有点太密集了,肝快废了。凌晨2点半,Claude发3.7Sonnet,凌晨5点半,阿里发了推理模型QwQ-Max的预览版,早上10点DeepSeek开源了一个DeepEP代码库,然后晚上10点20,阿里的视频模型万相2.1,也来了。既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

  • 百度短剧:生态赋能下的行业新航向——从流量盛宴到长效价值重塑

    据《 2025 中国网络视听发展研究》显示,短剧市场规模已突破 800 亿,但用户增速却处于平缓期,宣告着市场正从狂热扩张步入精细运营的新纪元。短剧行业面临三大棘手难题:内容同质化,如同复制粘贴的“甜宠”、“逆袭”故事,让观众审美渐行渐远;变现模式单一,付费分账独大,多元盈利路径仍在蹒跚学步;短剧热度难持久,长尾价值挖掘不足。短剧行业已进入“提质减量

  • 融合DeepSeek,首个AI信贷大模型工程研究中心落地金蝶

    金蝶征信经广东省科学技术厅权威认定,正式获评“广东省企业信贷风险智能识别与控制大模型工程技术研究中心”,成为全省唯一入选的企业级AI信贷风控大模型技术研发机构。这是继发布苍穹GPT企业财务管理大模型后,金蝶在AI赋能企业服务领域的又一突破性进展。”目前,金蝶征信以工程技术研究中心为枢纽,与金融机构共建联合建模实验室,推动行业决策从“经验驱动”转向“数据智能”,“让每一家踏实经营的企业都能获得金融助力。