首页 > 业界 > 关键词  > Motion-I2V最新资讯  > 正文

视频生成模型Motion-I2V:支持控制视频运动轨迹

2024-02-04 10:19 · 稿源:站长之家

站长之家(ChinaZ.com)2月4日 消息:Motion-I2V是一种新型的视频生成模型,可以像Runway的运动笔刷一样控制视频生成。它能够从一张静态图片生成连贯且可控制的视频,效果惊人!这个技术还能对生成视频进行运动控制,例如可以生成一辆车在道路上行驶的视频,而且还能控制车辆的行驶方向和速度等细节。

image.png

项目地址:https://top.aibase.com/tool/motion-i2v

Motion-I2V的主要功能特点包括:

1、图像到视频的自动转换,能够将静态图像自动转换成连贯的动态视频,通过模拟图像中对象的自然运动,使静态图像“活”起来。

2、显式运动建模,通过两个阶段的处理,首先预测图像中物体的运动轨迹,然后根据这些轨迹生成动态视频,这种方法明确考虑物体的移动方式,使生成的视频更加自然和真实。

3、Motion-I2V还支持用户精确控制视频中的运动轨迹和运动区域,为用户提供了比传统方法更高的可控性。生成的视频不仅在视觉上连贯,而且用户可以通过简单的操作控制视频内容,使得生成的视频既满足特定的视觉要求,又能反映用户的创意意图。

4、Motion-I2V还支持将一个视频转换为另一个风格的视频,而无需额外的训练样本,这一功能基于其先进的运动增强和时间注意力技术。

工作原理是将整个图像到视频的转换过程分为两个步骤,并且在这两个步骤中明确地考虑了物体的移动情况。

第一步骤是预测图片中物体的移动轨迹,通过一个特别设计的预测器来实现,它能够基于当前的图片和一些指令来预测出物体的移动方式。

第二步骤是根据这些轨迹将图片中的内容“拖动”到视频的每一帧中去,从而创建出连贯的视频。与其他类似技术相比,Motion-I2V的优势在于它生成的视频不仅看起来更连贯,而且用户还可以更精确地控制视频中的运动情况。

此外,这个技术还能够做到从一个视频转换到另一个视频,而不需要额外的训练数据,这是通过在第二步骤中引入的一种新技术实现的。

举报

  • 相关推荐
  • 从“实现需求”到“共创价值”:AI Native时代需要什么样的工程师团队?

    在1024程序员节,小红书技术副总裁风笛出席CCF工程师文化日五周年庆典,分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码,其余被会议沟通挤占,导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式:通过任务导向的扁平化组织,让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例,展示新型协作效能。强调AI不会取代工程师,而是将其角色提升至系统定义和复杂性管理的新高度。

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • 999元起!联想moto g100s开售:LCD护眼屏、支持微信/抖音6开

    联想官方今天宣布,moto g100s正式开售,定价是999元起。 这是近期少有的LCD手机,搭载6.72英寸LCD防蓝光无频闪护眼屏,支持120Hz高刷新率与全局DC调光,硬件级过滤蓝光、消除频闪,局部峰值亮度1050nits。 内置7000mAh超大容量电池,采用10%硅负极技术提升能量密度,电池循环寿命超1000次,6年使用后容量仍80%,支持30W有线快充 搭载第四代骁龙6s处理器,性能满足日常社交、短视�

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 7000mAh+1050尼特LCD屏!联想moto g100/s AI手机发布:999元起

    联想10月31日发布moto g100系列手机,主打LCD屏幕与长续航。配备6.72英寸120Hz自适应刷新率LCD屏,支持全程DC调光;搭载骁龙7s Gen2处理器,内置7000mAh大电池,支持30W快充。后置双摄组合满足日常拍摄,支持NFC、侧边指纹识别。moto g100售价1399元(12+256GB),moto g100s起售价999元,均提供四年质保服务。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

  • 九号公司举办首届「MoTech Day 2025」:让技术回归生活,让创新成为日常

    10月24日,九号公司举办首届“MoTech Day 2025”技术文化节,这是专属于工程师的节日,也是公司首次以“技术文化”为核心议题的集团级活动。活动通过嘉宾演讲、互动体验与创意挑战等形式,聚焦智能出行、AI芯片、能源技术等前沿领域,旨在让“工程师精神”成为九号文化的核心符号,推动技术与文化双向融合,构建长期创新驱动力。活动还同步推出面向高校的“MoTech创意挑战赛”,并搭建线下互动打卡区,强化内部技术认同与组织活力,重塑品牌科技形象。

今日大家都在搜的词: