对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

2025-05-21 11:09 · 稿源：快科技

快科技5月21日消息，在今年的I/O开发者大会上，谷歌发布第三代视频生成模型 Veo 3。

据悉，Veo 3对标OpenAI的Sora，具备生成视频的同时同步嵌入音效的能力。

谷歌表示，Veo 3不仅可以基于文本和图像提示生成高质量的视频，还能为人物对白、鸟鸣或街头交通等场景配上相应的音效，实现更逼真的视听体验。

谷歌DeepMind产品副总裁Eli Collins表示：从文字和图像提示，到真实世界物理效果与精准的唇形同步，Veo 3的表现都非常出色。”

目前，该模型主要面向美国地区的Gemini Ultra订阅用户，每月收费249.99美元。

此外，Veo 3也将纳入谷歌面向企业客户的Vertex AI平台。

除了Veo 3外，谷歌还发布了多个与生成式AI相关的新产品，包括升级版图像生成模型Imagen 4、电影制作辅助工具Flow。

此外，谷歌还宣布对原来的Veo 2进行更新，并新增支持通过文字提示对视频中物体进行增删的功能。

目前，生成式AI在图像和视频创作领域的应用日益普及。

不过值得注意的是，谷歌在AI图像生成领域的历史并非一帆风顺。

2024年，谷歌因Imagen 3模型生成带有历史错误的图像内容而遭遇广泛批评，随后被迫重新发布该工具。

谷歌联合创始人Sergey Brin后来坦承，问题源于测试不充分”。

（举报）

相关推荐

关键词：

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品：1）Seedance 1.0 lite视频生成模型，支持5-10秒480P/720P视频生成，具备影视级画质和生成速度优势，适用于电商广告、影视创作等场景；2）豆包1.5视觉深度思考模型，仅20B参数但具备多模态理解能力，在60项基准测试中38项达SOTA水平；3）升级版豆包音乐模型，新增英文歌曲创作功能，并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

AI模型升级视频生成技术火山引擎发布
腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造，支持文本、图像、音频等多模态输入，能生成高质量定制视频。主要功能包括：单/多主体视频生成、视频配音、局部编辑等，在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景，如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源，其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

多模态视频生成腾讯混元 HunyuanCustom
持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

快手旗下可灵AI 2.0模型在权威AI评测中表现优异，以1124分超越自研1.6版本，连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示，自2023年6月上线以来，可灵AI全球用户突破2200万，月活激增25倍，累计生成视频1.68亿个、图片3.44亿张。商业化方面，其单月流水已超千万元，并与伊利、vivo等头部品牌达成深度合作，展现出AI视频生成技术的广阔商业前景。
视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出，在VBench评测中超越Sora等国内外顶尖模型，支持1080p高清视频生成，每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果，支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业，大幅降低创作门槛。

国产视频生成 Vidu Q1
荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势
荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

本文报道了AI领域最新动态：1)阿里通义万相开源视频编辑统一模型VACE；2)OpenAI发布GPT-4.1增强编码能力；3)Stability AI推出超轻量341M文字转语音模型；4)快手可灵视频生成模型占据30%市场份额；5)微软WizardLM团队整体加入腾讯混元大模型研发体系；6)腾讯宣布混元图像2.0将于5月16日发布；7)上海成立人工智能标识生态联盟；8)Lightricks发布13B参数视频生成模型LTX-Video；9)谷歌DeepMind推出AlphaEvolve优化AI训练速度；10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

人工智能视频编辑开源项目
荐生成视频好看还不够，还要能自由探索！昆仑万维开源Matrix-Game，单图打造游戏世界

世界模型的进度条，最近坐上了火箭。去年11月，两家创业公司打造的 Oasis，首次在开源世界模型中实现了实时、可玩、可交互。生成的虚拟环境不仅包含画面，也体现出了对物理和游戏规则的理解。

世界模型人工智能虚拟环境
微软CEO：公司多达 30% 的代码是由 AI 生成的！

微软首席技术官凯文·斯科特（Kevin Scott）曾表示，预计到 2030 年，将有 95% 的代码是由 AI 生成的……

微软 meta开发者大会 Llamacon
仅用三张图像即可生成 3D 场景，苹果新 AI 模型“很惊人”

只需三张输入图像，Matrix3D 就能生成物体、甚至整个环境的详细 3D 重建，这显然可以为 Apple Vision Pro 等沉浸式头显带来非常有趣的应用……

苹果AI模型 Matrix3D 苹果机器学习

热文

3 天
7天

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

荐生成视频好看还不够，还要能自由探索！昆仑万维开源Matrix-Game，单图打造游戏世界

微软CEO：公司多达 30% 的代码是由 AI 生成的！

仅用三张图像即可生成 3D 场景，苹果新 AI 模型“很惊人”

热文

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

OpenAI 推出首款成熟编程 AI 代理 Codex

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

iOS 19 或将大幅提升你 iPhone 的电池续航能力

AI 驱动高效转型，Klarna 人均收入飙升至近 100 万美元

欧洲准备试行“开放网页索引”，以减少对谷歌、必应的依赖

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

42岁程序员因AI被裁，失业一年，现蜗居房车，靠跑腿维生

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

苹果 AI 太落伍？他们需要从对手那里“复制”这三个功能

日产 N7 电动车在中国创下新纪录，18 天订单突破 1 万台

OpenAI 推出首款成熟编程 AI 代理 Codex

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

站长商机