谷歌推全新AI视频生成模型Veo，可创建高质量60秒、1080p视频

2024-05-15 10:31 · 稿源：站长之家

划重点:
- 谷歌发布了名为 Veo 的生成式 AI 视频模型，可以创建高质量、逼真的1080p 视频片段。
- Veo 支持文本到视频、视频到视频以及图像到视频的转换，能够应用于多种电影风格。
- 谷歌与艺术家 Donald Glover 合作测试 Veo 的新功能，展示出令人惊叹的视频生成能力。

站长之家（ChinaZ.com）5月15日消息:谷歌在其深度学习 AI 部门 DeepMind 的研究人员发布了一款名为 Veo 的全新式 AI 视频模型，能够创建“超过60秒的高质量、1080p 剪辑”，“从照片写实主义到超现实主义和动画，它可以应对一系列电影风格”，在逼真度和视觉果方面达到了令人惊叹的水平。

Veo 的目标是帮助各类用户创作视频，不论是经验富的电影制片人、有抱负的创作者，还是渴望分享知识的教育工作者，都可以通过 Veo 实现的故事叙述方式。

Veo 支持文本到视频、视频到视频以及图像到视频的转换，能够适各电影风格，从写实主义到超现实主义和动画。

谷歌与艺术家 Donald Glover 合作，通过他的创工作室 Gilga 测试了 Veo 的一些新功能。DeepMind 在 YouTube 和 X 平台上发布了一些由 V 生成的视频和提示，包括霓虹城市、真实的海洋水母、牛仔骑马、太空飞船穿越虚空和真的人物场景等。这些视频几乎无法与真人拍摄或专业的计算机生成动画区分开，而且都是由文本提示生成的。

图片来自谷歌官方用Veo生成视频截图

Veo 不仅可以根据文本提示生成视频，还可以快速编辑 AI 生成的视频用户上传的片段，甚至是预先录制的真人镜头。当给定一个输入视频和编辑命令时，比如在海线的航拍画面中添加皮划艇，Veo 可以应用这个命令到初始视频，并创建一个新的编辑后的视频。此，Veo 还能够实现视频帧之间的一致性，避免一些奇怪和令人不安的转换瑕疵，这得益于其采用了先进的潜在扩散变压器技术，可以减少这些不一致之处使角色、物体和风格保持在现实生活中的位置。

为了提高生成视频的质量，谷歌在练数据的每个视频标题中添加了更多细节，并使用高质量、压缩表示视频（也称为潜在变量），从而高了效率。此外，所有的 Veo 视频都嵌入了 SynthID，即谷歌的内容凭证跟踪数字水印以确保可以被有识别能力的机构识别为由 AI 生成。

Veo 是 DeepMind 多年研究的结晶，建在之前的研究成果基础上，包括生成查询网络（GQN）、DVD-GAN、Imagen-Video、Phenaki、ALT、VideoPoet 和 Lumiere 等。目前，谷歌并没有公开发布 Veo，只提供给少数特定的创作者私人预览中使用。未来，谷歌还计划将 Veo 的部分功能引入 YouTube Shorts 和其他产品中。

（举报）

相关推荐

关键词：

Veo
AI视频

谷歌Gemini整合Veo 2视频生成模型，8秒720P视频轻松搞定

谷歌宣布又有一款 AI 模型将加入 Gemini，但这次它不仅仅是一个聊天机器人。

谷歌谷歌gemini veo2
豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品：1）Seedance 1.0 lite视频生成模型，支持5-10秒480P/720P视频生成，具备影视级画质和生成速度优势，适用于电商广告、影视创作等场景；2）豆包1.5视觉深度思考模型，仅20B参数但具备多模态理解能力，在60项基准测试中38项达SOTA水平；3）升级版豆包音乐模型，新增英文歌曲创作功能，并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

AI模型升级视频生成技术火山引擎发布
视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出，在VBench评测中超越Sora等国内外顶尖模型，支持1080p高清视频生成，每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果，支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业，大幅降低创作门槛。

国产视频生成 Vidu Q1
低端显卡登上AI的大船！6GB显存就能生成高质量视频

快科技4月20日消息，GitHub的Lvmin Zhang联合斯坦福大学的Maneesh Agrawala，发布了一项突破性的新技术FramePack，通过在视频扩散模型中使用固定长度的时域上下文，可以更高效地生成时间更长、质量更高的视频。根据实测，基于FramePack构建的130亿参数模型，只需一块6GB显存的显卡，就能生成60秒钟的视频。FramePack是一种神经网络架构，使用多级优化策略，完成本地AI视频生成。目前，�
持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

快手旗下可灵AI 2.0模型在权威AI评测中表现优异，以1124分超越自研1.6版本，连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示，自2023年6月上线以来，可灵AI全球用户突破2200万，月活激增25倍，累计生成视频1.68亿个、图片3.44亿张。商业化方面，其单月流水已超千万元，并与伊利、vivo等头部品牌达成深度合作，展现出AI视频生成技术的广阔商业前景。
腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造，支持文本、图像、音频等多模态输入，能生成高质量定制视频。主要功能包括：单/多主体视频生成、视频配音、局部编辑等，在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景，如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源，其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

多模态视频生成腾讯混元 HunyuanCustom
索尼Xperia 1 VII发布：1080P屏+骁龙8 Elite 售价过万

索尼发布Xperia 1 VII旗舰手机，售价1499欧元（约11980元）。配备6.5英寸FHD+屏幕，搭载骁龙8 Elite处理器，12GB+256GB存储。影像系统是最大亮点：后置三摄采用全新1/1.35英寸Exmor T传感器，支持85-170mm连续光学变焦（3.5-7.1倍），配合AI技术可显著提升低光拍摄表现和动态范围。5000mAh电池支持30W快充，保留3.5mm耳机孔。该机主打专业影像功能，特别适合拍摄人像和光学散景效果，视频色彩表现达影院级水准。

索尼Xperia 1 VII
AI简历教程！用 deepseek 一键生成高质量简历

本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件，过程繁琐。现在通过Deepseek平台，只需输入自然语言指令（如工作经验、技能等关键信息），系统即可自动生成排版精美的HTML版简历，还能转换为PDF格式。操作流程分三步：1.访问官网输入需求指令；2.查看并运行生成的HTML代码；3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历，大幅提升求职效率。

深度思考R1模型 AI简历制作求职工具
可灵AI开启视频生成2.0时代！全球用户数已突破2200万

4 月 15 日，快手可灵AI在北京中关村国际创新中心举行“灵感成真”2. 0 模型发布会，宣布基座模型再次升级，面向全球正式发布可灵2. 0 视频生成模型及可图2. 0 图像生成模型。

可灵2.0 可灵AI 快手
DeepSeek + Kimi一键生成高质量PPT

文章介绍如何用两个免费AI工具快速制作PPT：先用微信版DeepSeek生成大纲，再用Kimi智能助手一键生成PPT。操作步骤包括：1）在微信搜索DeepSeek，输入需求生成结构化大纲；2）访问Kimi网页版，将大纲粘贴至PPT助手功能；3）选择模板样式，一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景，能自动完成从构思到排版的全部流程，高效且效果惊艳。

AI工具 PPT制作 DeepSeek

热文

3 天
7天

谷歌推全新AI视频生成模型Veo，可创建高质量60秒、1080p视频

谷歌Gemini整合Veo 2视频生成模型，8秒720P视频轻松搞定

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

低端显卡登上AI的大船！6GB显存就能生成高质量视频

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

索尼Xperia 1 VII发布：1080P屏+骁龙8 Elite 售价过万

AI简历教程！用 deepseek 一键生成高质量简历

可灵AI开启视频生成2.0时代！全球用户数已突破2200万

DeepSeek + Kimi一键生成高质量PPT

热文

奥特曼：使用 ChatGPT 的方式，暴露了你的年龄！

仅用三张图像即可生成 3D 场景，苹果新 AI 模型“很惊人”

2026年苹果产品迎来革命性升级：折叠屏iPhone/全新MacBook Pro

不丹率先为游客提供国家级加密支付

四年来，软银集团首次实现年度盈利，重振投资者信心

微软宣布全球裁员超 6000 人，占比约 3%

AI侵权纠纷愈演愈烈，特朗普罢免美国版权主管

在由人类创造的“AI驱动”的世界里，人类该何去何从？

三星、LG本月开始为iPhone 17批量生产OLED面板

2027 年太晚了？随着竞争加剧，iPhone 已失去光彩

C++创始人：需要改变的不是语言，而是开发者的思维方式！

奥特曼：使用 ChatGPT 的方式，暴露了你的年龄！

仅用三张图像即可生成 3D 场景，苹果新 AI 模型“很惊人”

2026年苹果产品迎来革命性升级：折叠屏iPhone/全新MacBook Pro

不丹率先为游客提供国家级加密支付

四年来，软银集团首次实现年度盈利，重振投资者信心

站长商机

​谷歌推全新AI视频生成模型Veo，可创建高质量60秒、1080p视频

热文

站长商机

谷歌推全新AI视频生成模型Veo，可创建高质量60秒、1080p视频