阿里出品!DreaMoving:图片+文字提示就能生成高质量舞蹈视频

2023-12-12 14:20 · 稿源：站长之家

**划重点:**
1. 🌐 **框架介绍:** DreaMoving是一种基于扩散模型的可控视频生成框架，基于图文就能制作高质量定制的人类跳舞视频视频。
2. 🔄 **架构解析:** 文中提出了Video ControlNet和Content Guider两大关键组件，分别负责运动控制和身份保留，可适用于各种风格化的扩散模型。
3. 🎬 **成果展示:** DreaMoving通过姿势序列和简单的内容描述，如文本和参考图像，生成高质量、高保真度的定制视频。

站长之家（ChinaZ.com）12月12日消息:DreaMoving由阿里巴巴集团的一组研究人员倾力打造，一种基于扩散模型的可控视频生成框架，。该框架的核心目标基于图文就能生成高质量、定制化的人类舞蹈视频。

DreaMoving以其出色的扩散模型为基础，能够根据人物的身份和姿势序列生成目标身份在任何地方跳舞的视频。

DreaMoving 可以生成高质量和高保真度的视频，给定指导序列和简单的内容描述，例如文本和参考图像作为输入。具体来说，DreaMoving 通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。

比如你“投喂”一张人像，以及一段prompt就能生成对应的视频，而且改变prompt，人物背景和身上的衣服也会跟着变化。

为实现这一目标，该技术引入了Video ControlNet和Content Guider两个关键组件。

Video ControlNet:这是一个图像ControlNet，通过在每个U-Net块后注入运动块，处理控制序列（姿势或深度）以产生额外的时间残差。这有效实现了对运动的控制。

Content Guider:该组件负责将输入文本提示和外观表达，如人脸（衣物是可选的），转换为内容嵌入，实现跨注意力的传递。

值得一提的是，目前DreaMoving项目并没有开源代码。点击前往DreaMoving官网体验入口

项目网址:https://dreamoving.github.io/dreamoving/

论文网址:https://arxiv.org/abs/2312.05107

（举报）

相关推荐

关键词：

短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐爱诗科技，一家AI视频创业公司的生存哲学

“你还是回去吧，大模型在中国没有机会。” 2023年刚创业，爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。但两年时间过去，两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

AI视频生成 Sora爆火商业化元年
荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

Sora2爆火之后，随之而来的AI视频领域的新产品。来自我的好朋友，曹越老师的Sand.ai。凌晨，他们终于上线了他们全新的音画同步视频模型GAGA-1，在人物表演上，我觉得，已经算是现在的TOP级了。

AI视频 GAGA-1 音画同步
保时捷女销冠被合成AI不雅视频：称被造黄谣已报案

近日，连续两年蝉联青岛保时捷中心销售冠军的女销售牟倩文，因遭遇AI伪造视频恶意诽谤事件引发广泛关注。这位在2023年、2024年累计售出170台保时捷的销冠，通过个人社交账号发布声明称，近期发现大量利用AI技术合成的虚假视频在网络传播，这些视频内容纯属伪造，已对其个人名誉及正常生活造成严重影响。据牟女士介绍，不法分子不仅通过AI技术制作与其面部特征相似�
保时捷女销冠称被合成AI不雅视频本人：坚决追究涉案人员的法律责任

近日青岛保时捷销售中心的工作人员牟女士称，近期发现由AI恶意合成的虚假视频和不良视频，对其进行诽谤和侮辱，她已报案。当事人表示，她坚决追究所有涉案人员的民事及刑事责任。牟女士在接受采访时表示，她之前曾经历过被人造黄谣，但这次不太一样，造谣视频在不断发酵，可能有900多万浏览量，还有人给我打电话，说一些不合适的话。公开报道显示，牟女士今�

AI虚假视频网络诽谤保时捷销冠
AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

AI搜索时代，传统SEO面临三大变革：用户行为从点击链接转向AI直接生成答案，搜索入口从索引排名转向生成式引用，内容机制更注重权威性与结构化数据。SEO并未消亡，而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况，核心目标从"排名第一"转向"被AI优先选中"。

AI搜索 SEO影响流量结构
青岛保时捷女销冠被人用AI合成不雅视频涉事男子被行拘手写悔过书

日前，青岛保时捷中心销售冠军牟倩文发文称，近期发现有人利用AI技术恶意合成虚假、不良视频，这些视频是百分之百伪造的”，并表示对造谣者宣战”。今日，牟倩文在社交平台再发文，晒出青岛市公安局李沧分局行政处罚决定书。行政处罚决定书显示，一男子在群内转发牟某文照片图文并搭配不雅视频，对其侮辱，后被查获。

AI技术虚假视频行政处罚
为什么AI搜索会“抛弃”传统SEO?

AI搜索正颠覆传统搜索生态，用户从“找链接”转向“得答案”。传统SEO三大策略失效：首页排名概念消失，关键词堆砌失效，外链权重减弱。新时代GEO（生成引擎优化）关注内容结构化、权威性和语义丰富度。建议使用AIBase等工具监测品牌在AI回答中的曝光率，通过优化内容质量提升被引用概率。这是从流量竞争到信任度构建的范式转移。
荐“AI家教”火了，哪家大厂领跑？

各大应用榜单刚刚公布的9月数据，揭示出一个AI应用新风向——教育类AI应用正加速崛起。多家机构的数据显示，这一赛道的月活用户（MAU）与下载量双双上涨，部分产品涨幅甚至逼近1000%。以非凡产研的数据为例，好课帮助教育旗下的“光速写作”凭借场景定位与功能体验，月环比下载增速高达926.59%，科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计，月活跃用�

AI应用教育类AI 月活用户
荐AI +游戏，何以撑起百亿市场？

今年以来，生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上，使用生成式AI技术的游戏数量呈现出惊人增长，激增了800%。行业预测显示，在今年新上市的游戏中，这一应用比例预计将达到20%。游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

生成式AI 游戏领域 Steam平台

今日大家都在搜的词：

热文

3 天
7天

阿里出品!DreaMoving:图片+文字提示就能生成高质量舞蹈视频

短视频加速跑入AI时代

荐爱诗科技，一家AI视频创业公司的生存哲学

荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

保时捷女销冠被合成AI不雅视频：称被造黄谣已报案

保时捷女销冠称被合成AI不雅视频本人：坚决追究涉案人员的法律责任

AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

青岛保时捷女销冠被人用AI合成不雅视频涉事男子被行拘手写悔过书

为什么AI搜索会“抛弃”传统SEO?

荐“AI家教”火了，哪家大厂领跑？

荐AI +游戏，何以撑起百亿市场？

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

火车免费坐？12306今起又上新功能：积分可兑换车票

红米REDMI K90 Pro Max官宣搭载7560mAh电池

余承东官宣华为路由X3 Pro 采用“日照金山”设计

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

站长商机