首页 > 业界 > 关键词  > MotionCtrl最新资讯  > 正文

研究人员推视频运动控制器MotionCtrl 可有效独立控制摄像机和物体的运动

2023-12-08 11:08 · 稿源:站长之家

要点:

  • MotionCtrl是一种用于视频生成的统一而灵活的运动控制器,能够有效地独立控制摄像机运动和物体运动,实现更精细和多样化的运动控制。

  • MotionCtrl通过两个模块,即摄像机运动控制模块(CMCM)和物体运动控制模块(OMCM),以及精心设计的架构和训练策略。

  • 通过CMCM和OMCM的独立训练和结合LVDM,MotionCtrl能够在相对有限的数据集上进行训练,并在生成视频时灵活地控制摄像机和物体的运动,展示出较之前方法更为出色的性能。

站长之家(ChinaZ.com)12月8日 消息:近年来,视频生成领域取得了显著进展,但对于视频中的摄像机和物体运动的准确控制仍然是一个挑战。传统方法往往集中在其中一种运动类型,或者在两者之间没有明确的区分,从而限制了运动控制的多样性。为了解决这一问题,研究人员开发了一种名为MotionCtrl的技术,可以通过手绘的轨迹来控制摄像机和视频中物体的运动轨迹。该技术还支持Animatediff,希望在开源后能够有相应的节点插件。

MotionCtrl能够独立有效地控制摄像机运动和物体运动,实现更精细和多样化的运动控制。其架构考虑了摄像机运动和物体运动的固有属性,通过CMCM和OMCM模块分别处理这两种运动类型。这使得在生成的视频中可以实现更细致的运动调整,并灵活地组合这两种运动类型,提高了控制的多样性。

image.png

论文地址:https://arxiv.org/pdf/2312.03641.pdf

MotionCtrl的运动条件由摄像机姿态和轨迹决定,这些条件与外观无关,最小程度地影响生成视频中物体的外观或形状。这使得MotionCtrl生成的视频在保持物体自然外观的同时,能够准确地反映所给摄像机姿态和轨迹,提高了生成视频的真实感。

MotionCtrl是相对通用的模型,一旦训练完成,能够适应各种摄像机姿态和轨迹,无需对每个摄像机或物体运动进行精细调整。这增强了模型的泛化能力,使其在不同情境下都能表现出色。

该项目的优势在于,它可以有效地独立控制摄像机和物体的运动,实现更精细的运动控制,促进两种类型运动的灵活多样组合。此外,该技术的运动条件由摄像机的姿势和轨迹确定,与视频中物体的外观或形状影响最小。

MotionCtrl的实现方法是通过添加相机运动控制模块(CMCM)和物体运动控制模块(OMCM)来扩展LVDM的去噪U-Net结构。CMCM通过将相机姿态序列RT附加到第二个自注意模块的输入中,并应用一个定制的轻量级全连接层来提取相机姿态特征,将其与LVDM的时间变换器进行集成。

为了训练MotionCtrl,研究人员采用了一种多阶段的训练策略,并使用特定的增强数据集,以满足摄像机运动和物体运动控制的训练需求。对于摄像机运动控制模块(CMCM),研究人员选择了Realestate10K数据集,并通过Blip2生成视频片段的文字描述。对于物体运动控制模块(OMCM),由于缺乏同时包含摄像机姿态、文字描述和物体运动轨迹的综合数据集,研究人员采用了ParticleSfM来生成物体运动轨迹,并通过Gaussian filter进行优化。

实验结果表明,MotionCtrl相对于现有方法在运动控制方面表现出色,具有更高的生成视频质量和更灵活的运动控制能力。

举报

  • 相关推荐
  • 技嘉科技 STEALTH Revolution 玩转简约装机美学 力邀创作者打造纯白梦幻桌机

    技嘉科技推出STEALTH Revolution活动,主打纯白美学装机概念。活动以X870AORUS STEALTH ICE主板为核心,邀请全球创作者打造个性化桌机。该系列采用背插式设计,简化装机流程,释放机箱空间,便于展示水冷设备和RGB灯效。新品涵盖X870/B850主板、RTX5090显卡及全景机箱等,联合10余家机箱品牌推出20余款兼容产品。活动提供限量主板供参赛者使用,并开放大众投票评选优秀作品,参与者有机会赢取丰厚奖品。技嘉旨在推动"背插主板×纯白机身"的装机新潮流,满足市场对简约风格的需求。

  • 运动疲劳如何快速缓解?iRest艾力斯特按摩椅为专业运动疲劳恢复提供全新方案

    文章探讨运动性疲劳问题及其解决方案。传统消除疲劳方式包括营养补充和物理放松两类,但专业按摩人员短缺且费用较高。iRest艾力斯特按摩椅提供更便捷高效的恢复手段,经与温州医科大学合作研究证实,能有效改善运动员肌肉疲劳状况,降低肌肉硬度,促进恢复。按摩椅操作简便、性价比高,适合专业运动员和普通运动爱好者使用,为大众健康生活提供了智能便捷的解决方案。

  • 别人偷偷拿走小米YU7后排控制屏怎么办 小米考虑到了

    有车主好奇,如果小米YU7的后排控制屏不小心被乘客带走了,怎么办? 对此,小米汽车今天给出解答,后排控制屏具备防丢模式”,大家无需担心。 如果乘客不小心带着后排屏离开车辆,后排控制屏和中控屏都会及时提醒。 后排控制屏会响铃,同时显示防丢提醒页面,提示乘客后排屏可能带出车外,尽快放回车内原处”。 与此同时,中控屏上方也会展示后排屏已带出车外

  • 中科新松推人形机器人双机,自主移动+柔顺控制赋能智造升级

    2025年机器人赛道持续升温,中科新松推出两款人形机器人"睿可MR73A"和"睿可MR73B"。MR73A侧重交互与灵巧操作,具备27个自由度的双臂系统,支持语音交互和AI视觉技术;MR73B聚焦高效物流搬运,具备智能升降和自主导航能力。两款产品突破传统工业机器人局限,强调移动性、环境感知与人机协作,瞄准工业4.0柔性制造和商业服务场景。中科新松通过核心技术平台实�

  • YY 直播首部 AIGC 真人短剧上线!实现了制作效率与成本控制的双重突破

    YY直播旗下短剧厂牌麦芬推出首部AIGC真人短剧《权谋之帝王心术》,取材于平台主播真实故事,联合百度AIGC技术实现剧本创作与视觉制作的智能化。该剧制作成本较传统模式降低58%,周期缩短53%,通过多平台分发扩大传播范围。作为"生态短剧"创新尝试,既展现YY在内容领域的深耕,也验证了AIGC技术在影视制作中的降本增效能力,为行业探索"真实生态+智能技术"的内容生产新模式提供了实践样本。

  • TikTok电商抢滩日本,有哪些机遇和挑战?

    ​TikTok电商全球化布局再落一子。 6月30日,TikTok正式在日本上线电商业务,核心模式为直播带货。品牌、卖家及创作者可通过发布含购物功能的视频或直播,在TikTok内直接销售商品。 在东南亚、美区等市场,TikTok电商已证明了其直播带货模式的爆发力。如今全球化布局再下一城,给从业者带来了哪些新的机遇和挑战? TikTok Shop在日本上线 早在4月28日,TikTok日本正式宣布推出

  • 冉莹颖透露邹明轩长高的秘密:健康运动饮食助力

    ​7月1日晚,冉莹颖在社交平台晒出儿子邹明轩打篮球的动态视频,并配文深情表示,拍摄时多次眼红落泪,感慨看着孩子从蹒跚学步到如今身高猛蹿,往昔回忆涌上心头,同时祝愿所有小朋友都能平安健康地成长。视频中,14岁的邹明轩活力满满,身高已明显超过身高164cm的母亲冉莹颖,几乎高出一个头,身形也较以往清瘦挺拔,引得网友纷纷留言惊叹:“当年《爸爸去哪儿》�

  • 三星AI神系列洗护产品:一站式解决洗衣难题 解锁夏日运动穿搭自由

    三星推出AI神+黑钻热泵洗烘旗舰与衣物护理机,解决运动爱好者夏季洗衣难题。洗烘一体机98分钟完成全流程,配备AI智能感知衣物重量和面料,自动调节水位和洗涤剂用量,避免混洗染色问题。衣物护理机采用双气流+双蒸汽系统,能除菌除味、抚平褶皱,内置香氛盒让运动衣物清新如新。两款产品通过创新科技简化家务流程,让用户轻松保持运动装备洁净,随时享受清爽穿搭体验,实现运动热情与精致生活的完美结合。

  • 运动到全场景,从上海 ISPO看韶音如何领跑开放式耳机领域

    2025年7月4日,Shokz韶音在ISPO亚洲运动用品展上大放异彩。其专业运动耳机OpenRun Pro2凭借DualPitch™骨传导技术、IP55防水和12小时续航等创新功能,入选"ISPO China Choice"榜单。同时展出的OpenDots ONE采用动钛弧设计实现稳固佩戴,OpenFit2通过海豚弧耳挂提升舒适度。现场提供镌刻服务,吸引众多观众体验。数据显示,韶音已连续两年登顶全球运动耳机销量榜首,2024年在中国开放式耳机市场持续领跑。品牌通过技术创新不断突破骨传导音质上限,满足用户多样化需求。

  • 出门问问发布Agentic AI软硬结合产品TicNote,定义新一代“AI思考伙伴”

    出门问问发布新一代AI硬件TicNote,内置"Shadow AI"系统,实现"有记忆的AI记录+主动洞察+主动分析+陪伴创作"功能。该产品通过软硬件结合,成为用户的随身AI思考伙伴,适用于会议、商务沟通、学习等场景。TicNote具备20小时续航、10米远距收音、120+语言转写能力,支持跨文件项目管理。CEO李志飞表示,TicNote是"用AI的AI做AI"的AGI实践产品,标志着公司在软硬结合道路上更进一步。国内版已上线,海外版自2025年4月推出以来获广泛认可。