谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

2024-02-26 13:49 · 稿源：新智元公众号

【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism，在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练，性能刷新30项SOTA。AI视频模型Sora爆火之后，Meta、谷歌等大厂纷纷下场做研究，追赶OpenAI的步伐。最近，来自谷歌团队的研究人员提出了一种通用视频编

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

2025年11月5日，世界超高清视频产业联盟在深圳举办UWA+峰会，宣布中国自主三维音频标准“菁彩声”（Audio Vivid）车载应用装机量突破100万台。该标准基于AI技术，支持7阶HOA渲染与128轨实时处理，解码延迟低于80ms，实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型，获IEC国际标准认证，与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态，推动中国音频产业从技术领先迈向市场引领。

菁彩声 Audio Vivid
荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
以算力为基，优刻得与IDEA共建低空经济新格局

10月24日，粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部，与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向，将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作，整合云计算与产业资源优势，促进低空经济全链条发展，把握战略机遇，引领产业健康、智能、可持续发展新阶段。

低空经济数字经济战略性新兴产业
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
平安云原生AI算力资源调度平台，荣获IDC “AI-就绪数字基础设施领军者优秀奖”

近日，IDC公布2025年中国未来企业大奖获奖名单，平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术，显著提升资源利用率约30%，降低运营成本，并支持金融级高可用与弹性伸缩，助力企业高效应对AI推理与训练场景需求，体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

AI算力云原生数字基础设施
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android
超擎速度！全国首批NVIDIA DGX Spark率先抵达超擎数智，现货在仓，交付启动

10月19日，全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场，为企业和科研机构提供强劲算力。产品预装完整AI软件栈，实现开箱即用，配备详细快速指南和专业支持团队，助力开发者无缝对接顶尖计算能力，加速AI本地化开发创新。

NVIDIA DGX Spark
Vidda 火星基地亮剑：C5 领衔四件套，改写影音产品性能规则

Vidda在AWE展会发布多款创新产品：C5无界Master投影仪搭载SST架构DMD芯片、双激光器和122mm影院级镜头，实现6800CVIA高亮度和精准色彩；发现X2026电视采用"墨晶屏"技术，解决强光反光问题；同时推出V11开放式耳机与G11智能眼镜，以轻量化设计提升佩戴体验。整场发布会通过实机拆解和极限测试，展现品牌"技术平权"理念，强调用户体验优先于参数竞争。
逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

逗哥配音平台凭借AI语音技术革新，为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源，支持多语言合成，具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具，结合去水印、字幕生成等实用功能，实现一站式创作。已获超百位大V推荐，用户量破千万，累计播放量达十万亿级，显著降低创作门槛，助力各领域内容生产。团队将持续优化技术，拓展功能生态。

AI配音内容创作语音合成

今日大家都在搜的词：

热文

3 天
7天

谷歌AI视频再出王炸！全能通用视觉编码器VideoPrism，性能刷新30项SOTA

菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

荐Sora App的AI视频社交，给了百度们新希望

以算力为基，优刻得与IDEA共建低空经济新格局

荐短视频加速跑入AI时代

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

平安云原生AI算力资源调度平台，荣获IDC “AI-就绪数字基础设施领军者优秀奖”

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

超擎速度！全国首批NVIDIA DGX Spark率先抵达超擎数智，现货在仓，交付启动

Vidda 火星基地亮剑：C5 领衔四件套，改写影音产品性能规则

逗哥配音团队：以硬核技术铺就AI创作未来，重塑短视频创作生态

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

文件传输工具奶牛快传宣布12月8日正式停止服务

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

站长商机