首页 > 业界 > 关键词  > MotionDirector最新资讯  > 正文

MotionDirector:AI定制视频新方法

2023-10-18 09:28 · 稿源:站长之家

要点:

1. 该研究提出了MotionDirector,一种基于人工智能的方法,用于自定义视频的运动和外观,通过训练模型学习运动和外观,以生成特定运动的视频。

2. MotionDirector采用双通道架构,分别学习单一或多个参考视频中的外观和运动,实现外观和运动的解耦,并能够合并不同源视频的外观和运动。

3. 该研究通过对多个基准数据进行比较,表明MotionDirector在生成具有多样性和所需运动概念的视频方面具有潜力,尽管有一些改进的空间。

站长之家(ChinaZ.com)10月18日 消息:最新研究指出,文本到视频传播模型在最近取得了显著进展,用户只需提供文本描述,就可以创建逼真或富有想象力的视频。这些基础模型还被调整以生成与特定外观、风格和主题匹配的图像。

然而,在文本到视频生成中自定义运动的领域仍需要深入探讨。用户可能希望创建具有特定运动的视频,比如汽车前进然后左转。因此,将扩散模型调整以创建更具体内容以满足用户的需求变得非常重要。

image.png

项目地址:https://showlab.github.io/MotionDirector/

为了解决这一问题,研究人员提出了MotionDirector,这是一种双通道架构的人工智能方法,旨在训练模型学习给定单个或多个参考视频中的外观和运动,使其能够同时实现运动的自定义和外观的多样性。

其中,空间通道包含了一个基础模型,其在每个视频的变换层中集成了可训练的空间LoRAs(低秩适应),这些LoRAs是通过在每个训练步骤中随机选择的单帧来进行训练,以捕捉输入视频的视觉属性。与此相反,时间通道复制了基础模型,与空间通道共享空间LoRAs,以适应给定输入视频的外观。此外,时间通道中的时间变换器还使用从输入视频中选择的多帧进行训练,以捕捉固有的运动模式。

通过部署经过训练的时间LoRAs,基础模型可以合成具有多样外观的学习运动的视频。这种双通道架构使模型能够分别学习视频中物体的外观和运动,从而使MotionDirector能够隔离视频的外观和运动,然后从不同的源视频中进行组合。

研究人员通过在多个基准数据上比较MotionDirector的性能,包括80多种不同的运动和600个文本提示。在UCF体育动作基准测试中,MotionDirector被人工评定者约75%的时间选择,以获得更好的运动保真度,该方法还胜过了25%的基准模型的首选项。

在第二个基准测试中,即LOVEU-TGVE-2023基准测试中,MotionDirector表现优于其他可控生成和调整方法。这些结果表明,MotionDirector可以定制多个基础模型,以生成具有多样性和所需运动概念的视频。

总之,MotionDirector是一种有潜力的新方法,可用于调整文本到视频传播模型,以生成具有特定运动的视频。它在学习和适应物体和摄像机的特定运动方面表现出色,并可以用于生成具有各种视觉风格的视频。

尽管在学习参考视频中多个主体的运动方面仍有改进空间,但即便存在这些限制,MotionDirector仍有潜力增强视频生成的灵活性,使用户能够制作符合其需求的定制视频。

举报

  • 相关推荐
  • 苹果破天荒史诗升级!iPhone 17标准版首次支持Pro Motion:120Hz高刷

    iPhone 17系列终于在万众期待中亮相,首先介绍的就是屏幕,采用更窄边框的6.3英寸屏幕。 大家盼望多年的重磅升级终于来了标准版首次支持高刷。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • Panduit 泛达荣获EcoVadis企业可持续发展表现银牌评级

    泛达公司宣布荣获EcoVadis企业可持续发展银牌评级,位列全球前6%,彰显其在环境责任与可持续商业实践方面的坚定承诺。该评估覆盖环境、劳工与人权、商业道德及可持续采购四大核心领域,包含21项可持续发展指标。泛达全球可持续发展经理Mark Dehmlow表示,这一成就证明公司在环境管理、道德采购及员工健康安全方面的努力正产生可衡量影响。作为全球领先的电气与网络基础设施解决方案制造商,泛达将持续提升可持续发展表现,契合市场期望,并支持合作伙伴生态系统及行业优先发展事项。

  • 苹果史上最薄的手机 影视飓风Tim现场掰iPhone Air

    昨日,苹果2025秋季发布会公布新款手机iPhone17系列,并推出主打轻薄的iPhone Air。 而在苹果发布会结束后,影视飓风Tim立刻来到现场,线下对iPhone17系列实机进行了拍摄。 据悉,iPhone Air机身厚度仅5.5mm,约为三个硬币那么厚。 在视频中,Tim不仅全面解析了Air系列的极致轻薄设计、标准版的性价比大招,甚至还在现场直接上手试着掰了一下iPhone Air,测试新机钛合金的结构强度�

  • 安信证书双节钜惠:DigiCert OV SSL证书限时直降,立省1099元!

    安信证书推出中秋国庆双节特惠活动,DigiCert SSL证书限时优惠,最高直降1099元。涵盖四款OV企业型证书,包括基础版、高级版、通配符版及专业版,适用于不同企业网站安全需求。活动期间享免费安装、重签及到期提醒服务,助力企业低成本实现HTTPS加密升级。活动时间截至2025年10月20日,企业可前往官网优惠申请。

  • “无人测试”新趋势:2025服贸会公布领先AI测试平台——Testin XAgent

    在数字化浪潮下,软件质量成为企业核心竞争力。传统测试依赖人工,面临效率瓶颈、覆盖局限和技术门槛三大痛点。AI技术正推动测试从自动化向智能化变革。Testin云测发布新一代AI智能测试系统Testin+XAgent,融合大语言模型和智能体技术,实现自然语言驱动测试、高精度视觉识别、全自动API测试和自主探索式测试,重塑测试流程。该系统代表软件测试向“无人测试”升级,助力中国技术出海,彰显AI+测试的全球竞争力。

  • 女子用ChatGPT选号中百万大奖 全部捐出帮助有需要的人

    美国弗吉尼亚州女子卡丽爱德华为非经常购彩者,近日通过手机向ChatGPT询问彩票号码建议,AI提供几组数字供参考。她购买后幸运中得15万美元(约106万元人民币)大奖。领奖时她当场宣布将全部奖金捐出,帮助有需要的人,并表示自己已足够幸运,希望以此鼓励其他中奖者回馈社会。

  • Claude 用不了?蓝耘 Coding Agent 提供原生替代方案,更轻量、高性价比的替代选择

    Anthropic宣布停止向中国资本控股企业提供Claude服务,蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本,提供可视化控制台和本地化服务,助力开发者无缝衔接开发流程,确保工作连续性。

  • Testin云测:“无人测试”新范式,软件质量保障迎来全自动时代

    在数字经济时代,软件质量成为企业竞争力的关键。传统测试面临高人工依赖、高维护成本和高技能门槛的“三高”困境,自动化测试脚本月均失效率高达25%,维护占测试人员60%以上工作量。Testin云测推出XAgent智能测试平台,通过AI技术实现测试效率提升85%,核心场景覆盖率提升300%,脚本维护成本降低30%,重构质量保障体系。该平台已在金融、汽车等行业应用,显著提升测试效能,推动企业数字化转型。

  • HUAWEI WATCH GT 6系列全新发布: 驭风而行 实力进阶

    9月24日,华为发布HUAWEI WATCH GT 6智能手表,主打“驭风而行”理念,兼顾运动健康与时尚设计。新品搭载全新高硅叠片异形电池,续航大幅提升,Pro版最长可达21天。升级版向日葵定位系统提升定位精度20%,新增骑行模拟功率功能,适配越野跑、滑雪等户外场景。健康管理全面升级,支持12种情绪识别及房颤负荷统计功能。设计上,Pro版采用立式计时表圈,46mm款灵感源自骑行,41mm款更小巧轻盈。售价1488元起,9月29日正式开售。

今日大家都在搜的词: