首页 > 业界 > 关键词  > Veo最新资讯  > 正文

​谷歌推全新AI视频生成模型Veo,可创建高质量60秒、1080p视频

2024-05-15 10:31 · 稿源:站长之家

划重点:

- 谷歌发布了名为 Veo 的生成式 AI 视频模型,可以创建高质量、逼真的1080p 视频片段。

- Veo 支持文本到视频、视频到视频以及图像到视频的转换,能够应用于多种电影风格。

- 谷歌与艺术家 Donald Glover 合作测试 Veo 的新功能,展示出令人惊叹的视频生成能力。

站长之家(ChinaZ.com)5月15日 消息:谷歌在其深度学习 AI 部门 DeepMind 的研究人员发布了一款名为 Veo 的全新式 AI 视频模型,能够创建“超过60秒的高质量、1080p 剪辑”,“从照片写实主义到超现实主义和动画,它可以应对一系列电影风格”,在逼真度和视觉果方面达到了令人惊叹的水平。

image.png

image.png

Veo 的目标是帮助各类用户创作视频,不论是经验富的电影制片人、有抱负的创作者,还是渴望分享知识的教育工作者,都可以通过 Veo 实现的故事叙述方式。

Veo 支持文本到视频、视频到视频以及图像到视频的转换,能够适各电影风格,从写实主义到超现实主义和动画。

谷歌与艺术家 Donald Glover 合作,通过他的创工作室 Gilga 测试了 Veo 的一些新功能。DeepMind 在 YouTube 和 X 平台上发布了一些由 V 生成的视频和提示,包括霓虹城市、真实的海洋水母、牛仔骑马、太空飞船穿越虚空和真的人物场景等。这些视频几乎无法与真人拍摄或专业的计算机生成动画区分开,而且都是由文本提示生成的。

image.png

图片来自谷歌官方用Veo生成视频截图

Veo 不仅可以根据文本提示生成视频,还可以快速编辑 AI 生成的视频用户上传的片段,甚至是预先录制的真人镜头。当给定一个输入视频和编辑命令时,比如在海线的航拍画面中添加皮划艇,Veo 可以应用这个命令到初始视频,并创建一个新的编辑后的视频。此,Veo 还能够实现视频帧之间的一致性,避免一些奇怪和令人不安的转换瑕疵,这得益于其采用了先进的潜在扩散变压器技术,可以减少这些不一致之处使角色、物体和风格保持在现实生活中的位置。

为了提高生成视频的质量,谷歌在练数据的每个视频标题中添加了更多细节,并使用高质量、压缩表示视频(也称为潜在变量),从而高了效率。此外,所有的 Veo 视频都嵌入了 SynthID,即谷歌的内容凭证跟踪数字水印以确保可以被有识别能力的机构识别为由 AI 生成。

Veo 是 DeepMind 多年研究的结晶,建在之前的研究成果基础上,包括生成查询网络 (GQN)、DVD-GAN、Imagen-Video、Phenaki、ALT、VideoPoet 和 Lumiere 等。目前,谷歌并没有公开发布 Veo,只提供给少数特定的创作者私人预览中使用。未来,谷歌还计划将 Veo 的部分功能引入 YouTube Shorts 和其他产品中。

举报

  • 相关推荐
  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • 做乐园,长视频拥抱线下的终极大考

    如果说过去十年中国长视频平台的竞争重点一直在“内容规模”、“会员数”与“时长争夺”这些线上指标上,那么进入2024–2025年之后,这场竞争的重心,正在悄然转向“线下”。 随着短视频、短剧对注意力的强势分流,用户的付费意愿、广告主的投放信心以及内容本身的价值空间都在被压缩,单纯依靠“剧好看”、“综艺够爆”已经无法支撑起平台增长的想象力。 一个�

  • 爱诗科技,一家AI视频创业公司的生存哲学

    “你还是回去吧,大模型在中国没有机会。” 2023年刚创业,爱诗科技创始人兼CEO王长虎收到了天使投资人朱啸虎的“劝退”。 但两年时间过去,两个节点颠覆了投资人对AI视频生成赛道的固有印象。先是

  • AI日报:阿里发布紧凑型Qwen3-VL模型;科大讯飞AI翻译耳机全球首发;Gemini代码惊现Veo3.1

    阿里巴巴发布紧凑型Qwen3-VL多模态模型,推动边缘设备AI应用;科大讯飞推出全球首款AI翻译耳机,支持60种语言实时翻译;谷歌NotebookLM集成图像生成功能,可将笔记转为动态视频;ChatGPT将于12月向成人开放限制内容并推出自定义交互功能;谷歌Gemini代码泄露Veo3.1视频模型升级迹象;马斯克宣布X平台将全面转向AI推荐系统;巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS;vivo公布X200系列影像升级计划;字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

  • 保时捷女销冠被合成AI不雅视频:称被造黄谣已报案

    近日,连续两年蝉联青岛保时捷中心销售冠军的女销售牟倩文,因遭遇AI伪造视频恶意诽谤事件引发广泛关注。这位在2023年、2024年累计售出170台保时捷的销冠,通过个人社交账号发布声明称,近期发现大量利用AI技术合成的虚假视频在网络传播,这些视频内容纯属伪造,已对其个人名誉及正常生活造成严重影响。 据牟女士介绍,不法分子不仅通过AI技术制作与其面部特征相似�

  • 投身短视频后,「极客」们不再孤单

    「Geek」一词在互联网和科技产业的崛起过程中,本来仅指向比尔·盖茨、史蒂夫·乔布斯等对计算机科学和技术充满热情的人。在当下语境中,其含义则不断拓展,成为智慧、专业、创新和热情的代表,对某一领域或技术极度痴迷并具备深入了解、精通能力的人,都可称之为「极客」。 在科技发展普及、不断平权的当下,极客们拥有了更蓬勃的创造活力。今年来,以抖音、b站

  • 保时捷女销冠称被合成AI不雅视频 本人:坚决追究涉案人员的法律责任

    近日青岛保时捷销售中心的工作人员牟女士称,近期发现由AI恶意合成的虚假视频和不良视频,对其进行诽谤和侮辱,她已报案。当事人表示,她坚决追究所有涉案人员的民事及刑事责任。 牟女士在接受采访时表示,她之前曾经历过被人造黄谣,但这次不太一样,造谣视频在不断发酵,可能有900多万浏览量,还有人给我打电话,说一些不合适的话。 公开报道显示,牟女士今�

今日大家都在搜的词:

热文

  • 3 天
  • 7天