首页 > AI头条  > 正文

从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成

2025-05-21 08:47 · 来源: AIbase基地

在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。

Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。以下是AIbase整理的关于Veo3的核心亮点与技术突破。

image.png

原生音视频一体化生成,创作效率革命性提升

Veo3最大的突破在于其能够同时生成高质量视频与匹配的音频内容。无论是鸟鸣、街头交通的背景音,还是人物对话的口型同步音效,Veo3都能通过单一文本提示实现一体化的音视频生成。

这一功能让创作者无需额外进行音效匹配或后期剪辑,极大地简化了视频制作流程。谷歌表示,Veo3在物理模拟和口型同步方面表现尤为出色,能够生成符合现实物理规律的流畅画面与逼真音效。

超高分辨率与多样化风格支持

Veo3支持高达4K分辨率的视频生成,相较于前代Veo2在细节表现和画面连贯性上有了显著提升。无论是自然风景的延时摄影、电影化的跟踪镜头,还是广角构图的艺术效果,Veo3都能精准捕捉文本提示中的细微描述,生成多样化的电影风格视频。这一特性使其成为专业电影制作人、新兴创作者以及教育工作者的强大工具。

面向特定用户开放,集成AI影视制作生态

目前,Veo3仅对美国地区的Gemini Ultra订阅用户以及Vertex AI的企业用户开放,同时已集成到谷歌的AI影视制作工具Flow中。这一限制显示了谷歌对模型安全性和负责任使用的重视。据悉,Veo3内置了数字水印和安全筛选器,以防止内容滥用和虚假信息传播。谷歌还计划通过Google Labs的Whisk平台进一步扩展Veo3的应用场景。

Veo3的发布被视为谷歌对OpenAI Sora等竞品的强有力回应。社交媒体上,业内人士对Veo3的音视频一体化功能和高质量输出表示高度期待,认为其有望重塑电影制作、广告创意和教育内容创作的行业格局。然而,部分用户也指出,Veo3的实际效果仍需更多实测验证,尤其是在复杂场景下的表现。

结语

谷歌Veo3的问世,不仅展现了AI在视频生成领域的最新进展,也为创作者提供了更高效、灵活的工具。AIbase将持续关注Veo3的后续应用与用户反馈,期待其在内容创作领域的更多可能性。

  • 相关推荐
  • 对标Sora!谷歌发布AI视频生成Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 智邦国际一体化ERP:企业一体化智能一体成型,重塑企业未来

    近期制造业、轻工业、电子凭证、人工智能等领域密集出台政策,推动企业全方位数智化转型。智邦国际推出"企业一体化+"数智生态体系,以ERP为核心构建全维一体化管理平台,覆盖企业全生命周期各环节。其一体化ERP系统支持30多套软件灵活组合,并集成AI获客、智能客服等创新应用,帮助企业打通内外数据孤岛,实现从数字化向智能化的跃升。该方案通过一站式的数据互通和智能协同,正在成为企业降本增效的新引擎,引领万物互联时代的数智化转型浪潮。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 米粉苦等3年!小米盒子5系列今日开售:299元起 支持4K

    小米盒子5系列于5月15日晚8点正式开售,标准版299元、Max版499元。这是时隔3年推出的新品,搭载4核A55处理器,Max版升级至4GB+64GB存储。支持4K分辨率与AI-SR画质增强技术,可优化低分辨率片源。配备杜比视界和全景声,支持DTS:X环绕声技术。网络方面支持双频Wi-Fi6和蓝牙5.2,具备NFC一触投屏功能。搭载澎湃OS系统,支持智能家居控制和AI语音助手。

  • 火山引擎推出豆包·语音播客模型:文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 星影巨幕上新:三星100英寸Neo QLED 4K QN80F开启预售

    三星推出100英寸Neo QLED 4K QN80F巨幕电视,以AI音画革新重塑家庭影院体验。搭载NQ4 AI Gen2芯片,通过量子点矩阵技术和HDR10+动态色调映射,实现接近4K分辨率的画质提升。杜比全景声配合音画追踪技术,打造沉浸式3D音效。产品支持7年系统升级保障,并推出购机赠音响等优惠活动。智慧生态方面,整合SmartThings智能家居平台,实现跨设备联动控制。超窄边框设计让巨幕完美融入现代家居,重新定义客厅娱乐中心的价值维度。

  • o3模型基准测试分数仅为10%,远低于OpenAI宣传的25%

    OpenAI的新AI模型o3在第一方和第三方基准测试中存在差异,引发公众对其透明度和测试实践的质疑。去年12月,o3首次亮相时声称能解答超过25%的FrontierMath问题,但实际正确率仅为2%。内部测试发现,o3能达到超过25%的准确率,但其使用的计算资源比上周OpenAI推出的模型多得多。Epoch AI发布的独立基准测试结果显示,o3的得分约为10%,远低于OpenAI宣称的25%。尽管如此,这并不意味着OpenAI的说法有误,可能是因为OpenAI使用了更强大的内部架构进行评估,并采用了更多计算资源。此外,Epoch指出其测试设置可能与OpenAI不同,并且在评估中使用了更新版本的FrontierMath。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • 腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

今日大家都在搜的词:

热文

  • 3 天
  • 7天