快科技5月21日消息,在今年的I/O开发者大会上,谷歌发布第三代视频生成模型Veo 3。
据悉,Veo 3对标OpenAI的Sora,具备生成视频的同时同步嵌入音效的能力。
谷歌表示,Veo 3不仅可以基于文本和图像提示生成高质量的视频,还能为人物对白、鸟鸣或街头交通等场景配上相应的音效,实现更逼真的视听体验。
谷歌DeepMind产品副总裁Eli Collins表示:从文字和图像提示,到真实世界物理效果与精准的唇形同步,Veo 3的表现都非常出色。”
目前,该模型主要面向美国地区的Gemini Ultra订阅用户,每月收费249.99美元。
此外,Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。
除了Veo 3外,谷歌还发布了多个与生成式AI相关的新产品,包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。
此外,谷歌还宣布对原来的Veo 2进行更新,并新增支持通过文字提示对视频中物体进行增删的功能。
目前,生成式AI在图像和视频创作领域的应用日益普及。
不过值得注意的是,谷歌在AI图像生成领域的历史并非一帆风顺。
2024年,谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评,随后被迫重新发布该工具。
谷歌联合创始人Sergey Brin后来坦承,问题源于测试不充分”。
(举报)