首页 > AI头条  > 正文

谷歌 DeepMind 推出新技术:无 3D 模型也能生成真实运动视频

2025-06-04 08:50 · 来源: AIbase基地

近日,谷歌 DeepMind 团队与布朗大学合作,开发了一项名为 “力提示”(force prompting)的新技术。这项技术能够在没有3D 模型和物理引擎的情况下,生成逼真的运动效果,标志着人工智能视频生成领域的一大突破。

image.png

使用这项技术,用户只需简单地指定力的方向和强度,就可以操控 AI 生成的视频内容。力提示技术可以应用于全局力(例如:整体风力)和局部力(如:特定点的敲击)两种情况。输入的力量以矢量场的形式进入系统,随后被转换为自然流畅的运动,极大地提高了视频生成的真实感和动态表现。

研究团队基于 CogVideoX-5B-IV 视频模型,并加入 ControlNet 模块来处理物理控制数据。整个信号通过 Transformer 架构生成视频,每段视频由49帧组成,而训练过程只用了4台 Nvidia A100GPU,训练时间仅为一天。

值得注意的是,训练数据完全来源于合成,包括1.5万段不同风力下旗帜飘动的视频和1.2万段滚动球体、1.1万段花朵受冲击反应的视频。这些丰富的合成数据让模型能够在生成过程中,利用文本描述中的 “风” 或 “气泡” 等物理术语,自动建立正确的力与运动关系。

虽然训练数据的量相对有限,但模型展示出了强大的泛化能力,能够适应新物体、材质和场景,甚至掌握了一些简单的物理规则,比如在相同力量下,轻物体移动的距离远于重物。

用户测试显示,力提示技术在运动匹配度和真实感方面优于仅依赖文本或运动路径控制的基准模型,并且在质量上超越了基于真实物理模拟的 PhysDreamer。不过,在复杂场景中仍然存在一些不足之处,例如烟雾有时无法正确受到风力的影响,人体手臂的运动偶尔显得像布料般轻盈。

DeepMind 的首席执行官 Demis Hassabis 表示,下一代 AI 视频模型(如 Veo3)正逐步理解物理规则,不再局限于文本或图像处理,而是开始表征世界的物理结构。这被认为是迈向更通用 AI 的重要一步,未来的 AI 有望通过经验学习,在模拟环境中不断优化和提升能力。

项目页:https://force-prompting.github.io/

划重点:

🌟 新技术 “力提示” 可生成真实运动视频,无需3D 模型或物理引擎。  

⚙️ 用户通过简单的力的方向和强度操作,实现自然流畅的运动表现。  

📈 模型展现出强大的泛化能力,能够适应新场景和物体。

  • 相关推荐
  • 利用DeepSeek和豆包生成工作总结

    本文介绍如何利用AI工具快速撰写高质量工作总结。通过DeepSeek生成内容框架,再使用豆包填充具体内容,可大幅提升写作效率。操作步骤:1)在DeepSeek输入需求获取大纲;2)将大纲粘贴至豆包生成详细内容;3)根据需要进行调整优化。该方法适用于教师学期总结、员工季度报告、项目总结等多种场景,能有效节省时间精力,提升工作效率。

  • DeepSeek30秒极速生成年终总结

    本文介绍DeepSeek AI工具如何快速生成年终总结:1)支持上传文档、图片等多格式资料;2)输入简单指令即可10-30秒生成专业内容;3)可随时调整结果,补充数据或简化段落;4)支持导出Word/文本格式。操作流程:访问官网→上传资料→输入指令→生成内容→调整导出。该工具能显著提升职场人士撰写总结、报告等文档的效率,适合需要整合多份资料的工作场景。

  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

  • 如何用 DeepSeek 生成特定结构会议纪要

    本文介绍如何利用DeepSeek AI高效整理会议纪要。主要步骤包括:1)会议录音转文字(推荐使用"录咖"工具);2)登录DeepSeek官网输入指令,要求将会议记录按"决策事项/待办事项/风险预警"三部分结构化整理;3)检查优化生成的会议纪要。该方法能快速将杂乱会议内容转化为清晰文档,突出关键信息,提升工作效率。文中提供了具体操作流程和工具链接。

  • 如何使用 DeepSeek 生成商务谈判话术

    本文介绍如何利用DeepSeek AI工具在商务谈判中应对供应商压价。DeepSeek作为免费AI工具,可快速生成实用的谈判话术模板。操作流程包括:1.访问官网输入指令"模拟供应商压价场景,提供3种应对策略及话术模板";2.获取系统生成的3种专业应对方案。该工具能有效提升谈判效率,满足日常商务沟通需求,特别适合采购谈判场景使用。

  • 如何使用 DeepSeek 生成客诉流程图设计?

    文章介绍利用AI工具DeepSeek一键生成专业泳道图的方法。传统手动绘制流程耗时易错,现在只需输入指令,AI就能自动生成跨职能泳道图并标注SLA时间节点。该工具适合产品经理、客服主管等各类职场人士,能显著提升工作效率和图表质量。使用步骤:1.登录DeepSeek官网;2.输入生成指令;3.AI自动解析流程逻辑并生成标准化图表;4.支持SVG格式输出预览或下载。工具免费且操作简便。

  • 如何使用 DeepSeek 生成行业分析报告?

    本文介绍如何利用DeepSeek AI工具快速生成专业行业报告。在信息爆炸时代,该工具能高效完成市场分析、战略决策所需的行业研究。操作流程分四步:1.登录官网注册账号;2.输入指令并附相关资料(如"用金字塔原理分析汽车行业趋势");3.等待AI生成报告,简单指令几秒完成,复杂报告需几分钟;4.查看结果后可要求AI进行扩写或精简。该工具特别适合企业决策者和市场分析师使用,能显著提升行业研究效率。

  • AI简历教程!用 deepseek 一键生成高质量简历

    本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件,过程繁琐。现在通过Deepseek平台,只需输入自然语言指令(如工作经验、技能等关键信息),系统即可自动生成排版精美的HTML版简历,还能转换为PDF格式。操作流程分三步:1.访问官网输入需求指令;2.查看并运行生成的HTML代码;3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历,大幅提升求职效率。

  • 初中老师如何用deepseek 和 Kimi无痛做课件

    本教程指导初中教师如何利用Deepseek和Kimi两款AI工具高效完成备课全流程。Deepseek用于生成教学设计方案和PPT大纲,Kimi则根据大纲快速生成精美课件。操作步骤:1)在Deepseek输入教学需求生成教学设计;2)用Deepseek生成PPT大纲;3)将大纲粘贴至Kimi PPT助手一键生成课件。该方法特别适合日常备课、临时调课需求,能大幅提升备课效率,让教师既省时又高效。

  • 如何用DeepSeek生成高质量的竞品SWOT分析报告

    本教程介绍如何利用DeepSeek AI工具快速生成电商平台供应链SWOT分析报告。以京东vs拼多多为例,通过输入指定指令,AI可自动生成包含优势、劣势、机会和威胁四个维度的结构化分析报告,重点突出两者供应链能力差异。操作流程包括:1)登录DeepSeek官网进入对话界面;2)输入SWOT分析指令;3)获取AI生成结果。该方法能显著提升商业分析效率,建议结合最新行业数据对报告进�

今日大家都在搜的词: