首页 > 业界 > 关键词  > Sora最新资讯  > 正文

解决Sora物理bug!四所美国高校联合发布PhysDreamer模型

2024-05-06 15:30 · 稿源:站长之家

站长之家(ChinaZ.com)5月6日 消息:Sora视频生成器发布后不久,就被网友发现存在物理交互的bug,例如模型对物理世界的理解不足,导致小狗走路时前腿出现不自然的交错问题。为了解决这一问题,提升视频生成的真实感,来自MIT、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员联合提出了一种基于物理的方法模型——PhysDreamer。

image.png

项目地址:https://top.aibase.com/tool/physdreamer

论文链接:https://arxiv.org/pdf/2404.13026.pdf

PhysDreamer利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。通过提炼这些先验知识,PhysDreamer能够合成现实物体对全新交互的响应,如外力或智能体操作,并在弹性物体的不同示例上展现了该方法的效果。

问题形式化

PhysDreamer的目标是估计对象的物理材料属性场,以实现真实的交互式运动合成。具体来说,就是估计3D物体的空间变化杨氏模量场E(x),以进行粒子模拟。杨氏模量用来测量材料的刚度,决定物体响应外力作用的运动轨迹。

模型架构

PhysDreamer通过生成运动中物体的可信视频,然后优化材料场E(x)以匹配合成运动。给定一个表示为3D高斯的对象,首先从某个视点进行渲染,然后使用图像到视频生成模型来生成运动中物体的参考视频。接着,使用可微分材质点方法(MPM)和可微分渲染,对空间变化的材质场和初始速度场进行优化,旨在最小化渲染视频和参考视频之间的差异。

实验结果

研究人员收集了八个真实世界的静态场景,并捕捉了四个交互视频来说明其在交互后的自然运动。在用户研究中,超过80%的参与者在两项选择实验中更倾向于PhysDreamer模型,认为其在运动的真实性上更胜一筹;在视觉质量方面,也有65%的参与者更偏好PhysDreamer。

PhysDreamer模型的发布,为解决视频生成中的物理交互问题提供了一种有效的解决方案。通过估计物体的物理材料属性,PhysDreamer能够合成更加逼真的物体动态行为,显著提升了视频生成的真实感。这一研究成果有望推动视频生成技术的发展,为未来的应用带来更多可能性。

举报

  • 相关推荐
  • 企业选择雇佣AI员工,都有哪些优势价值?尘锋AI员工在哪些工作上表现优秀?

    AI在业务环境中的应用本质上是效率革命,能替代重复性工作,释放人力从事更高价值任务。AI员工可提升业务效率、降低用工成本、赋能人类创新,并需具备技术专业性、高开放性和数据安全性。选择AI员工应关注其业务理解能力、系统集成性及合规性,经过实践验证的AI方案能有效推动企业数字化转型,创造增长优势。

  • 腾讯会议宣布上AI托管功能:AI帮你参会 帮写完整会议纪要

    腾讯会议联合元宝推出AI托管功能,可提前或会中一键开启,由AI代为参会并实时记录内容,生成智能纪要。用户可随时切换会议状态,离场时AI持续记录,会后提供完整摘要,支持浏览会议小结或详细内容,还可一键导出至元宝拓展发问。该功能旨在解决突发状况,确保不错过重要信息。

  • 非洲女孩被AI识别出黑眼圈 网友:AI一视同仁

    ​9月10日,在上海外滩大会的热闹现场,一场关于AI测肤质的体验活动吸引了众多目光。其中,一位黑人女孩的体验过程尤为引人注目,她在使用AI测肤质功能后,竟被提示存在黑眼圈问题,需关注眼部皮肤状态及保养,这一结果瞬间引发了现场围观和网友热议。 据现场工作人员介绍,该AI测肤质功能通过先进的技术分析皮肤状况,不受肤色影响。当黑人女孩完成测试后,AI系�

  • AI日报:MiniMax Music 1.5上线;腾讯会议上线AI托管;蚂蚁外滩大会发布AI眼镜可信连接技术框架gPass

    本文介绍了AI领域的最新动态:MiniMax推出Music 1.5模型,支持4分钟高质量音乐生成;腾讯会议AI托管功能提供会议分身服务;蚂蚁集团发布AI眼镜连接框架gPass;Anthropic为Claude新增自动记忆聊天功能;苹果AI功能在欧盟受限;AI首次担任职业球队教练获胜;谷歌推出离线AI应用Edge Gallery;企业应用AI成熟度模型发布;Claude新增网页与PDF抓取功能;FTC启动对AI聊天机器人安全性的调查。

  • GEO技术与价值白皮书:抢占AI流量,构建品牌“AI可见性”

    喜签智能研究中心发布《生成式引擎优化(GEO)白皮书》,系统阐述AI时代内容优化新范式。白皮书指出,用户行为正从主动搜索转向AI问答,GEO通过提升内容在AI结果中的可见性、准确性与影响力,成为企业构建“AI可见性”的核心战略。报告详细对比GEO与传统SEO差异,提出企业应从内容审计、优化、监测三方面构建GEO能力,抢占AI流量红利。

  • 风口上的AI玩具:创业蓝海还是资本赌局?

    大厂高管创业优选、市场发展前景上佳、资本看好、没有技术壁垒、产品易落地……带着一连串的“光环”,AI玩具已经成为一项备受瞩目的创业热点。 从火山引擎(字节跳动旗下)与乐鑫科技合作推出AI玩具的开发套件“喵伴”,到百度智能云与实丰文化合作推出“AI魔法星”等,AI玩具作为创业与资本追逐的新风口,据IT桔子数据,该赛道已经吸引了96家投资机构的参与,包

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 智惠家AIGC——打造中国AI 服务第一入口

    文章探讨了从“互联网+”到“人工智能+”的信息技术革命深化进程,重点介绍了我国积极推动人工智能在各领域赋能与应用落地的举措。国务院印发《关于深入实施“人工智能+”行动的意见》,明确2027年新一代智能体应用普及率超70%的目标。智慧家AIGC响应政策,以社区家庭AI+教育场景为切入点,推出智能PAD等产品,通过免费使用策略获取用户流量,打造一站式服务平台,整合电商、本地生活及供应链资源,提供智能化、便捷化、个性化的新型生活服务。

  • 腾讯会议打通腾讯元宝,“AI托管”当你的听会助手

    腾讯会议上线“AI托管”功能,用户可授权AI助手元宝代为参会并自动生成会议纪要。该功能可解决多会议冲突、迟到漏信息、中途离场等问题,提升会议效率。元宝能实时记录关键内容,会后提供精准摘要,并支持后续查询。目前已在PC端和移动端同步上线,帮助用户从繁琐事务中解放,更专注于核心工作。

  • 人本位AI倾力打造“AI数据库共享服务中心”, 重塑工业AI时代新纪元!

    传统工业采购与供应模式存在信息壁垒、效率低下、成本高企、信任缺失等痛点。东莞市人本位网络技术有限公司推出“人本位AI询报比价系统”,基于AI智能解析与大数据算法,构建精准高效的智能匹配生态。该系统通过小程序实现供需秒级对接,极大提升供应链效率,为采购方提供一键发布、智能匹配服务,为供应方精准推送高意向订单,推动工业采购从“石器时代”迈向智能化变革。

今日大家都在搜的词: