谷歌提出生成式图像动力学:让静态图片动起来

2023-09-18 10:12 · 稿源：站长之家

站长之家（ChinaZ.com）9月18日消息:谷歌团队最新提出「生成图像动力学」，这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频，或者用于与图片中的对象进行交互。

项目地址：https://generative-dynamics.github.io/#demo

研究人员首先从包含自然振荡运动的真实视频中，如树叶摇曳、花朵飘动、蜡烛跳动和衣物飘扬等，提取运动轨迹。然后利用这些轨迹数据训练模型学习图像动力学的先验知识。对于任意输入图片，模型可以预测每个像素的长期运动表示，作者称之为神经随机运动纹理。这些表示随后转换为密集的运动轨迹，可生成整段视频。配合图像渲染模块，这些轨迹可以用于各种下游应用，如将静态图片转换成无缝循环视频，或者让用户可以与图片中的对象进行交互。

利用神经随机运动纹理，研究人员可以模拟对象对用户交互的响应。用户可以在图片中拖动一个点，然后释放手指，场景会根据点的位置和方向产生相应运动。用户还可以点击选择不同的图片进行交互。

通过调整运动纹理的振幅，研究人员可以放大或缩小物体的运动效果。他们还可以通过插值预测的运动纹理来生成慢动作视频。

该方法自动将单张静态图片转换成无缝循环视频，具有广阔的应用前景。它为创作更加逼真的数字内容提供了可能，如将电影片段的单帧转换为可交互的动态场景。该研究为基于单张图片合成视频开辟了新的思路。

特点:

（1）从视频中提取自然运动轨迹，训练获得图像动力学先验模型

（2）对静态图片预测像素级长期运动表示，即神经随机运动纹理

（3）将运动纹理转换为密集运动轨迹，合成动态视频

（4）支持用户与图片中的对象交互

（5）调整运动纹理振幅来控制运动效果

（6）通过插值产生慢动作视频

（举报）

相关推荐

关键词：

谷歌

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

AI模型全模态阿里云
亚马逊入局竞逐AR眼镜行业，Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

亚马逊正加速布局AR眼镜市场，开发两款产品：面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局，Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著，销量达26.2万台，同比增长73%。行业预计未来三年规模有望达千亿级别，AR眼镜正从"小众玩具"迈向"大众智能终端"。

AR眼镜亚马逊科技巨头
谷歌计划将谷歌云作为单独的报告细分市场

Google首席执行官Sundar Pichai周四宣布，从下个季度开始，该公司将在其收益报告中将Google Cloud作为一个单独的报告部门进行细分,其中将包含有关Google Cloud投资，营业收入和2018、2019和2020年的年度数据。这表明，谷歌看到了云业务的一个重大机遇，将可以推动公司的总体增长。谷歌云被广泛认为是云计算领域的第三大玩家，仅次于领先的亚马逊网络服务和第二大微软Azure。从下个季度开始，谷歌母公司Alphabet计划将Google Cloud

谷歌
谷歌

谷歌公司(Google Inc.)成立于 1998 年 9 月 4 日，由拉里·佩奇和谢尔盖·布林共同创建，被公认为全球最大的搜索引擎公司。

谷歌搜索谷歌广告 Google搜索
谷歌将补贴员工

昨日，谷歌母公司Alphabet的CEO桑德尔-皮查伊宣布将为员工提供至多 1000 美元的补贴，帮助他们支付购买在家办公设备的费用。此外，皮查伊还表示，从 7 月 6 日开始允许员工轮换上班，并将到岗率控制在10%，到 9 月份提高至30%左右。

谷歌安卓皮查伊
谷歌6月前不复工谷歌为什么在6月前不复工？

美国科技公司谷歌的CEO桑达尔·皮查伊在本周接受媒体采访时谈到了员工复工计划，他透露已经通知员工在6月1日之前不会回到办公室上班，将继续保持居家办公的要求。

谷歌谷歌复工谷歌6月前不复工
谷歌的“野心”哪去了？

周三，一年一度的谷歌开发者大会拉开帷幕，谷歌表现出了更加低调的一面...谷歌曾经拥有一批“登月项目”，试图解决全球性重大问题，包括无人驾驶汽车、高空互联网气球、智慧城市、送货无人机等...周三的大会缺少“惊叹”时刻...谷歌在演示如何继续改进其搜索技术时展示了一个名为“多搜索”的功能，用户可以对一个装满巧克力的架子拍照，然后从照片中找到评价最好而且没有坚果的黑巧克力棒...在花费了一个小时宣布其他消息后，谷歌提出了广告话题，强调了一个名为“我的广告中心”的新功能...从这次开发者大会来看，谷歌也不像以前那么高调了......

平板电脑 Pixel智能手机智能手表
谷歌警告不要在的华为手机上安装谷歌服务和应用

2月24日据notebookcheck报道，谷歌正式警告不要在较新的荣耀和华为智能手机上安装服务，Google Play商店和其他知名的Google应用程序。目前谷歌警告的对象为2019 年 5 月 16 日之后发布的华为和荣耀手机，例如Mate 30系列。但华为和荣耀正计划在今年年初还会发布多款手机产品。因此，这些即将推出的手机可能不支持谷歌服务，不过华为现在正在大力支持自动研发的HMS。

谷歌华为手机谷歌服务
谷歌取消线下大会

新冠病毒在全世界蔓延，给科技企业和互联网行业带来了越来越严重的影响。据外媒最新消息，谷歌日前宣布因为病毒疫情，将取消每年一度的线下云计算大会（但举办一个在线大会），另外在欧洲爱尔兰，谷歌通知 8000 名员工和承包商员工居家远程工作。“我们正在将活动转换为谷歌Cloud Next 20：Digital Connect，这是一项免费的、全球性的、数字优先的多日活动，包含流媒体主题演讲、分组讨论、互动式学习，以及向谷歌团队进行数字化专

谷歌取消线下大会谷歌疫情
将推新品?谷歌Tango团队已经并入谷歌VR部门!

据悉，谷歌Tango团队已经并入谷歌VR部门，具体要研究什么项目我们目前也不太清楚。CES2017上手机的AR功能由谷歌Tango团队老大Johnny Lee亲自上台演示，根据此前的消息，他们的团队已经并入谷歌VR部门，他需要直接向谷歌VR老大克雷巴沃尔汇报工作。也就是说，Daydream支持内置式追踪(Inside-Out)是板上钉钉的事情，我们不清楚的只是他们究竟做到哪一步了。AR的潜力可以说是毋庸置疑的，拿CES本身举例，会展空间很大，现场人山人海?

谷歌团队 VR

今日大家都在搜的词：

热文

3 天
7天

谷歌提出生成式图像动力学:让静态图片动起来

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

亚马逊入局竞逐AR眼镜行业，Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

谷歌计划将谷歌云作为单独的报告细分市场

谷歌

谷歌将补贴员工

谷歌6月前不复工谷歌为什么在6月前不复工？

谷歌的“野心”哪去了？

谷歌警告不要在的华为手机上安装谷歌服务和应用

谷歌取消线下大会

将推新品?谷歌Tango团队已经并入谷歌VR部门!

今日大家都在搜的词：

热文

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

荣耀Magic8系列暨MagicOS10发布会定档10月15日

iQOO 15搭载自研电竞芯片Q3 能效提升40%

真我官宣与理光达成影像战略合作：真我GT8 Pro首发搭载

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

比特币价格突破12.5万美元刷新历史最高纪录

雷军：小米17系列首销权益延续至10月31日

京东双11今晚开启：现货开卖官方直降低至一折

腾讯混元图像3.0登顶LMArena榜一

雷军：小米17系列开售仅5天销量破100万台

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

站长商机