首页 > AI头条  > 正文

Google Whisk新增Whisk Animate功能,Veo 2赋能图像转视频创作

2025-04-16 16:19 · 来源: AIbase基地

人工智能驱动的创作工具正在不断革新内容生产方式。AIbase从社交媒体获悉,Google Whisk近期迎来重大更新,新增Whisk Animate功能,允许用户将生成图片转化为由Veo2驱动的动态视频。这一功能需订阅Google One AI Premium会员方可使用,为创意专业人士和AI爱好者提供了全新的视频创作途径。以下是AIbase对Whisk Animate的深度解析,探索其功能亮点、用户反馈及行业影响。

QQ20250416-161825.jpg

Whisk Animate上线:从静态图像到动态视频

Whisk作为Google Labs推出的一项实验性AI工具,最初专注于通过图像提示生成创意视觉内容。AIbase了解到,新推出的Whisk Animate功能基于Google的先进视频生成模型Veo2,可将用户在Whisk中生成的静态图像转化为8秒钟的动态视频,分辨率为720p,格式为16:9的MP4文件。社交媒体反馈显示,这一功能因其简单操作和高品质输出受到早期测试者的热烈欢迎。

用户只需在Whisk中生成或上传图像,点击“ANIMATE”选项并输入动画提示词,即可快速获得生动逼真的视频片段。AIbase分析,Whisk Animate的推出将Whisk从图像创作扩展到视频领域,进一步丰富了Google Labs的生成式AI生态。

核心功能:Veo2驱动的动画创作

Whisk Animate依托Veo2的强大性能,带来了以下关键功能:

图像转视频:用户可将Whisk生成的图像(如卡通人物、风景插画)转化为动态视频,支持多种动画效果,如角色移动、场景过渡或物体变形。

高品质输出:Veo2以其对现实物理和人类动作的精准模拟,确保视频具有流畅的动作和逼真的细节,支持高达4K分辨率(Whisk Animate当前为720p)。

灵活提示控制:用户可通过文本提示指定动画风格或动作,例如“像素风格冰淇淋融化”或“森林中老鼠读书的动态镜头”,生成符合创意的视频。

安全与透明:所有Veo2生成的视频均嵌入SynthID数字水印,标记为AI生成内容,以降低误用风险并提升透明度。

AIbase注意到,社交媒体上已有用户分享了Whisk Animate生成的短视频案例,例如将静态插画转化为动态音乐视频,生成时间仅需半小时,效果被描述为“令人惊艳”。这些案例凸显了Veo2在短视频创作中的灵活性和高质量表现。

Google One AI Premium会员:解锁高级功能

Whisk Animate功能需订阅Google One AI Premium计划(每月20美元,含2TB存储空间)方可使用,订阅者每月可生成100个视频,配额每月刷新但不累计。AIbase了解到,该功能已于2025年4月15日起全球上线,支持Whisk可用地区的18岁以上用户。社交媒体反馈显示,尽管会员制限制了免费用户的使用,但付费计划的高性价比和额外功能(如Gemini Advanced访问权限)吸引了大量创意从业者。

与此同时,Whisk Animate的推出进一步强化了Google One会员的价值。AIbase观察到,Google通过订阅模式整合高级AI功能(如Veo2、Imagen3),为用户提供了从图像到视频的完整创作链条,显著提升了生态粘性。

技术亮点:Veo2与Whisk的协同创新

Whisk Animate的核心技术依托Veo2和Imagen3的协同工作。Veo2以其对电影摄影语言的理解和物理一致性优化,能够生成具有电影质感的视频,减少AI视频常见的伪影(如物体变形)。而Whisk通过Gemini模型的视觉理解能力,自动为用户上传的图像生成详细描述,再由Imagen3和Veo2转化为动画内容。

AIbase分析,这种图像-文本-视频的流水线架构极大简化了创作流程。用户无需深入掌握提示工程,仅需上传图像并提供简单指令,即可获得高质量结果。社交媒体上,开发者对Whisk Animate的控制精度表示认可,称其能准确捕捉图像的主体、场景和风格。

行业影响:AI视频创作的普及加速

Whisk Animate的发布进一步巩固了Google在AI视频生成领域的竞争力。AIbase观察到,与OpenAI Sora(需ChatGPT Plus订阅)或MiniMax等竞品相比,Whisk Animate通过图像驱动的创作方式提供了独特体验,特别适合快速将设计草图或插画转化为动态内容。社交媒体上,用户已开始探索其在短视频营销、动画原型和教育内容中的应用潜力。

对于创意产业,Whisk Animate降低了从静态到动态内容的创作门槛。AIbase预计,品牌营销团队可利用其快速生成社交媒体广告,独立创作者可用于YouTube Shorts或TikTok内容制作,而教育机构可打造交互式教学动画。然而,部分用户提到8秒时长限制可能制约复杂叙事,Google或将在未来放宽时长上限。

  • 相关推荐
  • AI日报:腾讯混元图像2.0毫秒级生图;Windsurf重磅发布SWE-1系列;MiniMax Speech-02登顶全球TTS榜首

    本期AI日报重点报道了多项AI领域最新进展:1)腾讯发布混元图像2.0模型,实现毫秒级图像生成;2)Windsurf推出全流程软件工程AI模型SWE-1系列;3)DeepSeek发布V3模型论文,揭示低成本训练大模型方法;4)Manus推出图像生成Agent,支持多工具协同完成任务;5)ElevenLabs发布可定制音效控制面板工具;6)MiniMax语音模型Speech-02超越OpenAI和ElevenLabs;7)DeepL升级翻译服务并推出写作助手;8)OpenAI占据AI工具市场80%份额;9)Llamafile 0.9.3支持Qwen3模型;10)Hugging Face推出WebGPU驱动的实时摄像头AI SmolVLM;11)Hugging Face上线免费MCP教程;12)复旦与腾讯联合推出视频生成工具DICE-Talk。

  • Google不革自己的命,AI搜索们也已经凉凉了?

    在刚刚结束的 Google I/O 开发者大会中,Google 宣布上线由 Gemini 驱动的高级 AI 搜索模式 AI Mode,可以应对复杂问题,支持追问。与之前的 AI Overviews 对 AI 搜索的浅尝辄止不同,Google 终于不再死抱着“关键词+链接列表”,开始拥抱“自然语言交互+结构化答案”的“新”范式了。 作为上一代搜索引擎的霸主,2024年,Google 的搜索业务贡献了1750亿美元,占总收入的一半以上,而转型

  • Google点燃了智能眼镜的导火索

    「Gemini,我刚才喝的那杯咖啡的咖啡馆叫什么?」 这是Google员工Nishtha两分多钟前在I/O大会后台做的一个动作,在此之后,她又和人打了招呼,并用智能眼镜识别了后台墙上的照片属于哪个乐队,然后又走到了I/O大会的舞台上和大家打了招呼。一系列动作后,Google的智能眼镜还是准确地帮她识别出这杯咖啡应该来自Castro街的Bloomsgiving咖啡馆。

  • 谷歌谢尔盖·布林:我在 Google Glass 上犯了很多错!

    相较于当年的 Google Glass,如今生成式 AI 的发展让智能眼镜的功能变得“更可实现”……

  • 声音革命!逗哥配音以独家达人声库重塑短视频创作新生态

    国内领先的智能配音平台"逗哥配音"推出全新升级的"臻品达人声库",通过动态扩容的独家声音资源和精准的风格适配能力,帮助短视频创作者提升内容吸引力。数据显示,使用该功能的短视频播放量达行业基准值的1.8倍。平台采用"数据优选+专业打磨"模式,精选超10亿播放量验证的顶级解说者资源,每季度新增20+达人声线,覆盖影视解说、游戏、好物推荐等20余个垂直领域。独创的"声效数据库"提供3000余种场景化音效模板,实现一键匹配专业级声场。某品牌营销案例中,创作者使用专属声线将产品视频转化率提升至15.7%。目前平台已覆盖微信小程序、PC端及移动APP全平台,支持80种语言实时转换。

  • Gemini接管搜索、全家桶秒变通用Agent ,以及Google Glass is so back!

    谁也没想到,Google I/O现场的最高潮来自“复活”的Google Glass有些翻车了的实时demo。2025 年 5 月 20 日,Google的年度开发者大会Google I/O在加州山景城举办。 与去年在举办之前一天被OpenAI“狙击”不同,今年的Google I/O,剑拔弩张的氛围让位给了派对的氛围,在ChatGPT带来的狼狈之后,Google已经回到了自己的节奏。 是的,它回到了饱和式发布的节奏。当天Google一口气发布了至少十�

  • AI日报:阿里开源3D数字人项目MNN TaoAvatar;MiniMax Agent上线;罗永浩数字人直播再探“AI+IP”带货模式

    本文汇总了AI领域最新动态:1)阿里开源MNN+TaoAvatar技术,实现手机端3D数字人实时交互;2)MiniMax升级AI工具Agent,新增智能图像搜索和多语言支持;3)罗永浩数字人将登陆百度电商直播;4)OpenAI员工套现近30亿美元,软银成最大接盘方;5)ChatGPT推出深度研究和语音模式升级;6)Meta发布V-JEPA2模型,提升机器人环境适应能力;7)AMD与OpenAI合作推出新一代AI芯片;8)Google Gemini集成Imagen4图像生成模型;9)谷歌AI实现10公里级精准天气预报;10)Gartner预测到2028年80%的AI应用开发时间将缩短50%。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • 用AI图像融合工具创造无缝图像融合,带来震撼视觉体验!

    AI图像融合工具正式上线,为您带来最先进的AI图像融合技术。借助这款工具,用户可以轻松地将多张图片融合成一张创意十足的视觉作品,展现无与伦比的艺术效果。

今日大家都在搜的词: