首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌提出生成式图像动力学:让静态图片动起来

2023-09-18 10:12 · 稿源:站长之家

站长之家(ChinaZ.com)9月18日 消息:谷歌团队最新提出「生成图像动力学」,这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频,或者用于与图片中的对象进行交互。

image.png

项目地址:https://generative-dynamics.github.io/#demo

研究人员首先从包含自然振荡运动的真实视频中,如树叶摇曳、花朵飘动、蜡烛跳动和衣物飘扬等,提取运动轨迹。然后利用这些轨迹数据训练模型学习图像动力学的先验知识。对于任意输入图片,模型可以预测每个像素的长期运动表示,作者称之为神经随机运动纹理。这些表示随后转换为密集的运动轨迹,可生成整段视频。配合图像渲染模块,这些轨迹可以用于各种下游应用,如将静态图片转换成无缝循环视频,或者让用户可以与图片中的对象进行交互。

利用神经随机运动纹理,研究人员可以模拟对象对用户交互的响应。用户可以在图片中拖动一个点,然后释放手指,场景会根据点的位置和方向产生相应运动。用户还可以点击选择不同的图片进行交互。

通过调整运动纹理的振幅,研究人员可以放大或缩小物体的运动效果。他们还可以通过插值预测的运动纹理来生成慢动作视频。

该方法自动将单张静态图片转换成无缝循环视频,具有广阔的应用前景。它为创作更加逼真的数字内容提供了可能,如将电影片段的单帧转换为可交互的动态场景。该研究为基于单张图片合成视频开辟了新的思路。

特点:

(1)从视频中提取自然运动轨迹,训练获得图像动力学先验模型

(2)对静态图片预测像素级长期运动表示,即神经随机运动纹理

(3)将运动纹理转换为密集运动轨迹,合成动态视频

(4)支持用户与图片中的对象交互

(5)调整运动纹理振幅来控制运动效果

(6)通过插值产生慢动作视频

举报

  • 相关推荐
  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • 谷歌计划将谷歌云作为单独的报告细分市场

    Google首席执行官Sundar Pichai周四宣布,从下个季度开始,该公司将在其收益报告中将Google Cloud作为一个单独的报告部门进行细分,其中将包含有关Google Cloud投资,营业收入和2018、2019和2020年的年度数据。这表明,谷歌看到了云业务的一个重大机遇,将可以推动公司的总体增长。谷歌云被广泛认为是云计算领域的第三大玩家,仅次于领先的亚马逊网络服务和第二大微软Azure。从下个季度开始,谷歌母公司Alphabet计划将Google Cloud

  • 谷歌

    谷歌公司(Google Inc.)成立于 1998 年 9 月 4 日,由拉里·佩奇和谢尔盖·布林共同创建,被公认为全球最大的搜索引擎公司。

  • ​谷歌将补贴员工

    昨日,谷歌母公司Alphabet的CEO桑德尔-皮查伊宣布将为员工提供至多 1000 美元的补贴,帮助他们支付购买在家办公设备的费用。此外,皮查伊还表示,从 7 月 6 日开始允许员工轮换上班,并将到岗率控制在10%,到 9 月份提高至30%左右。

  • 谷歌6月前不复工 谷歌为什么在6月前不复工?

    美国科技公司谷歌的CEO桑达尔·皮查伊在本周接受媒体采访时谈到了员工复工计划,他透露已经通知员工在6月1日之前不会回到办公室上班,将继续保持居家办公的要求。

  • 谷歌的“野心”哪去了?

    周三,一年一度的谷歌开发者大会拉开帷幕,谷歌表现出了更加低调的一面...谷歌曾经拥有一批“登月项目”,试图解决全球性重大问题,包括无人驾驶汽车、高空互联网气球、智慧城市、送货无人机等...周三的大会缺少“惊叹”时刻...谷歌在演示如何继续改进其搜索技术时展示了一个名为“多搜索”的功能,用户可以对一个装满巧克力的架子拍照,然后从照片中找到评价最好而且没有坚果的黑巧克力棒...在花费了一个小时宣布其他消息后,谷歌提出了广告话题,强调了一个名为“我的广告中心”的新功能...从这次开发者大会来看,谷歌也不像以前那么高调了......

  • 谷歌警告不要在的华为手机上安装谷歌服务和应用

    2月24日据notebookcheck报道,谷歌正式警告不要在较新的荣耀和华为智能手机上安装服务,Google Play商店和其他知名的Google应用程序。目前谷歌警告的对象为2019 年 5 月 16 日之后发布的华为和荣耀手机,例如Mate 30系列。但华为和荣耀正计划在今年年初还会发布多款手机产品。因此,这些即将推出的手机可能不支持谷歌服务,不过华为现在正在大力支持自动研发的HMS。

  • 谷歌取消线下大会

    新冠病毒在全世界蔓延,给科技企业和互联网行业带来了越来越严重的影响。据外媒最新消息,谷歌日前宣布因为病毒疫情,将取消每年一度的线下云计算大会(但举办一个在线大会),另外在欧洲爱尔兰,谷歌通知 8000 名员工和承包商员工居家远程工作。“我们正在将活动转换为谷歌Cloud Next 20:Digital Connect,这是一项免费的、全球性的、数字优先的多日活动,包含流媒体主题演讲、分组讨论、互动式学习,以及向谷歌团队进行数字化专

  • 将推新品?谷歌Tango团队已经并入谷歌VR部门!

    据悉,谷歌Tango团队已经并入谷歌VR部门,具体要研究什么项目我们目前也不太清楚。CES2017上手机的AR功能由谷歌Tango团队老大Johnny Lee亲自上台演示,根据此前的消息,他们的团队已经并入谷歌VR部门,他需要直接向谷歌VR老大克雷巴沃尔汇报工作。也就是说,Daydream支持内置式追踪(Inside-Out)是板上钉钉的事情,我们不清楚的只是他们究竟做到哪一步了。AR的潜力可以说是毋庸置疑的,拿CES本身举例,会展空间很大,现场人山人海?

今日大家都在搜的词: