首页 > 业界 > 关键词  > Motion-I2V最新资讯  > 正文

视频生成模型Motion-I2V:支持控制视频运动轨迹

2024-02-04 10:19 · 稿源:站长之家

站长之家(ChinaZ.com)2月4日 消息:Motion-I2V是一种新型的视频生成模型,可以像Runway的运动笔刷一样控制视频生成。它能够从一张静态图片生成连贯且可控制的视频,效果惊人!这个技术还能对生成视频进行运动控制,例如可以生成一辆车在道路上行驶的视频,而且还能控制车辆的行驶方向和速度等细节。

image.png

项目地址:https://top.aibase.com/tool/motion-i2v

Motion-I2V的主要功能特点包括:

1、图像到视频的自动转换,能够将静态图像自动转换成连贯的动态视频,通过模拟图像中对象的自然运动,使静态图像“活”起来。

2、显式运动建模,通过两个阶段的处理,首先预测图像中物体的运动轨迹,然后根据这些轨迹生成动态视频,这种方法明确考虑物体的移动方式,使生成的视频更加自然和真实。

3、Motion-I2V还支持用户精确控制视频中的运动轨迹和运动区域,为用户提供了比传统方法更高的可控性。生成的视频不仅在视觉上连贯,而且用户可以通过简单的操作控制视频内容,使得生成的视频既满足特定的视觉要求,又能反映用户的创意意图。

4、Motion-I2V还支持将一个视频转换为另一个风格的视频,而无需额外的训练样本,这一功能基于其先进的运动增强和时间注意力技术。

工作原理是将整个图像到视频的转换过程分为两个步骤,并且在这两个步骤中明确地考虑了物体的移动情况。

第一步骤是预测图片中物体的移动轨迹,通过一个特别设计的预测器来实现,它能够基于当前的图片和一些指令来预测出物体的移动方式。

第二步骤是根据这些轨迹将图片中的内容“拖动”到视频的每一帧中去,从而创建出连贯的视频。与其他类似技术相比,Motion-I2V的优势在于它生成的视频不仅看起来更连贯,而且用户还可以更精确地控制视频中的运动情况。

此外,这个技术还能够做到从一个视频转换到另一个视频,而不需要额外的训练数据,这是通过在第二步骤中引入的一种新技术实现的。

举报

  • 相关推荐
  • 苹果破天荒史诗升级!iPhone 17标准版首次支持Pro Motion:120Hz高刷

    iPhone 17系列终于在万众期待中亮相,首先介绍的就是屏幕,采用更窄边框的6.3英寸屏幕。 大家盼望多年的重磅升级终于来了标准版首次支持高刷。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • “无人测试”新趋势:2025服贸会公布领先AI测试平台——Testin XAgent

    在数字化浪潮下,软件质量成为企业核心竞争力。传统测试依赖人工,面临效率瓶颈、覆盖局限和技术门槛三大痛点。AI技术正推动测试从自动化向智能化变革。Testin云测发布新一代AI智能测试系统Testin+XAgent,融合大语言模型和智能体技术,实现自然语言驱动测试、高精度视觉识别、全自动API测试和自主探索式测试,重塑测试流程。该系统代表软件测试向“无人测试”升级,助力中国技术出海,彰显AI+测试的全球竞争力。

  • 做好“排头兵” 打造“安全感” 梧桐科技发布2025TTi品牌和产品升级方案

    9月16日,梧桐科技以“智启芯生·AI升舱”为主题举办2025 TTi品牌及产品发布会。TTi聚焦四大业务线,以打造有“安全感”的AI座舱为使命,进行全面产品升级。同时,梧桐科技联合合作伙伴发起“推动座舱AI音响发展”倡议,共建开放生态,赋能产业整体跃升。未来,TTi将围绕“可控感、熟悉感和松泛感”,聚焦TTi OS、TTi Sound、TTi Vision、TTi Eco四大业务线,持续打造比家更好的AI座舱体验。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 李想:没有“理想i7”这个车型 请大家不要等了

    9月22日,理想汽车CEO李想发文回应i7传闻,明确表示没有i7车型,并强调理想坚持“少而精”的产品策略,避免内部竞争。目前理想增程车型有L6-L9四款,纯电车型有i6、i8和MEGA三款,价格覆盖不同区间。i6价格将于9月26日公布,预计低于23万元,创理想价格新低,用户可根据预算直接选择i6或i8,无需等待中间车型。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 两步生成企业级Agent,华为云Versatile平台打通智能体落地最后一公里

    华为在2025全联接大会上发布企业级智能体平台Versatile,通过极简流程实现企业级Agent开发,仅需输入业务逻辑与流程图即可完成,效率提升10倍。同时公布昇腾芯片未来三年规划,将陆续发布多款高性能芯片。华为云还推出超节点产品Atlas系列,算力全球领先。CloudMatrix384 AI+Token推理服务全面上线,吞吐量达2400TPS,性能远超业界水平。该平台已与多个行业合作,助力企业构建数字化AI产线,实现业务效率飞速提升。

  • Testin云测:“无人测试”新范式,软件质量保障迎来全自动时代

    在数字经济时代,软件质量成为企业竞争力的关键。传统测试面临高人工依赖、高维护成本和高技能门槛的“三高”困境,自动化测试脚本月均失效率高达25%,维护占测试人员60%以上工作量。Testin云测推出XAgent智能测试平台,通过AI技术实现测试效率提升85%,核心场景覆盖率提升300%,脚本维护成本降低30%,重构质量保障体系。该平台已在金融、汽车等行业应用,显著提升测试效能,推动企业数字化转型。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

今日大家都在搜的词: