首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

力压Sora!谷歌第二代AI视频生成模型Veo 2发布:分辨率可达4K

2024-12-17 17:00 · 稿源: 快科技

**谷歌推出 Veo 2,第二代 AI 视频生成模型**

据悉,谷歌发布了其最新的 AI 视频生成模型 Veo 2。该模型能够生成高达 4K 分辨率(4096 x 2160 像素)和时长达 2 分钟的视频片段。

Veo 2 在分辨率和视频时长方面均展示了显著进步,比 OpenAI 的 Sora 模型分别提升了 4 倍和 6 倍。此外,它还能够在给定文本提示或文本和参考图像的情况下生成视频。

Veo 2 具备以下增强功能:

  • 保真度:细节、真实感和伪影减少得到显著改善。
  • 准确度:对物理世界的理解增强,能够精确地表示运动,遵循详细指令。
  • 相机控制:了解电影摄影的语言,能够创建各种拍摄风格、角度和动作。

为了降低 Deepfake 的风险,谷歌 DeepMind 使用专有水印技术 SynthID 将隐形标记嵌入到 Veo 2 生成的帧中,以确保视频内容的可追溯性和真实性。

除了 Veo 2,谷歌还推出了改进版的 AI 绘图模型 Imagen 3,该模型提供了更好的图像细节、更丰富的照明和更少的干扰。

Veo 2 网址:https://labs.google/fx/tools/video-fx

Imagen 3 网址:https://labs.google/fx/zh/tools/image-fx

谷歌第二代 AI 视频生成模型 Veo 2 发布

举报

  • 相关推荐
  • 对标Sora谷歌发布AI视频生成Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • Baidu Steamer-I2V推动视频生成技术突破,擎舵平台赋能原生创意营销

    百度推出全球领先的视频生成模型Baidu Steamer-I2V,以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化,能将静态图像转化为连贯动态视频。百度营销平台迎来2周年,已服务超13万家企业,日均生产素材超10万+。在"AI驱动营销全链路升级"主题下,百度与核心代理商共同探讨AIGC技术突破与创意升级,推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势,同时突破创意边界,实现营销效果飞跃。未来百度将优化模型性能,拓展应用场景,推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

  • 第二代IndoorLink头戴式无线讲解器,远距+动感,更好用了

    IndoorLink推出第二代头戴式无线讲解器,采用半透明壳体设计,重量更轻。通讯距离从200米提升至500米,抗干扰能力强,延迟低,适合马术、高尔夫等远距离教学场景。续航达7小时,配合专用充电宝可扩展至24小时。采用人体工学设计,TPE材质柔软舒适,支持多种佩戴方式,剧烈运动也不易脱落。音质表现优异,完美适配乐舞等团体教学场景,重新定义头戴式讲解器的使用边界。

  • vivo X Fold5首发第二代半固态电池技术:首次实现-30°C正常供电

    vivo产品经理韩伯啸介绍,去年,vivo X Fold3首发蓝海半固态电池技术,成为首款支持在-20℃极寒环境下正常运行的折叠屏。 今年,我们对X Fold5做了类似的测试,新一代X Fold5不仅防尘防水做到天花板,还带来了更强的第三防”,即使长时间的放在-20C的环境里,也能确保所有功能全部正常运行。 不仅如此,X Fold5首发第二代半固态电池技术,在前代的基础上,我们将固态电解质�

  • 雷军:小米玄戒O1采用第二代3nm工艺制程 力争跻身第一梯队

    小米公司创始人雷军宣布,小米正式推出其最新研发的旗舰芯片——小米玄戒O1。这款芯片采用第二代3nm工艺制程,标志着小米在高端芯片领域的重大突破,也展现了小米在半导体技术上的雄心壮志。 雷军在演讲中回顾了小米的芯片研发历程。早在2014年,小米便启动了芯片研发项目“澎湃”,并于2017年推出了首款手机芯片“澎湃S1”。然而,由于种种原因,小米的SoC大芯片研