首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

2024-02-26 13:49 · 稿源:新智元公众号

【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。最近,来自谷歌团队的研究人员提出了一种通用视频编

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成

    复旦大学与美团研究者提出UniToken框架,首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码,有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略(视觉语义对齐、多任务联合训练、指令强化微调),UniToken在多个基准测试中性能超越专用模型。其创新性体现在:1)统一的双边视觉编码

  • OpenAI 要砸 30 亿美金收购 AI 编码工具 Windsurf

    若收购成功,OpenAI 将直接与在快速发展的 AI 编码领域提供服务的 Anthropic、微软旗下的 GitHub、Anyscale 等公司展开竞争……

  • 深度系统deepin 23.1发布:NVIDIA显卡、Intel/AMD处理集体升级

    快科技4月16日消息,deepin深度操作系统团队发布了deepin 23.1版本,主要解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本重点改进:硬件兼容性与内核优化:集成Linux 6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU处理器微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;开发工具与跨平台支持:应用商店适配Debian/Ubuntu/Arch等子系统环境,支持快速启动;如意玲珑

  • 深度deepin 23.1正式发布!AI默认引擎切换至DeepSeek、修复超百问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • AI日报:阿里最新视觉推理模型QVQ-Max;可灵AI上新AI音效功能;GPT-4o升级后性能飙升;Midjourney V7将于下周发布

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里巴巴发布最新视觉推理模型QVQ-Max阿里巴巴旗下的AI研究团队Qwen发布了其最新的视觉推理模型QVQ-Max。尽管中美科技竞争加剧,该公司仍在寻求美国风投支持,因其专注于应用�

  • 阿维塔 06 上市!长安 + 华为王组合再出重拳

    文章主要内容为一场篮球比赛的回顾与分析。比赛结果为美国队以6分优势战胜德国队,得分分别为20.99。比赛结束后,美国队被评估为顶级球队ADS和德国队的头号对手。文章还详细分析了比赛的关键数据,如投篮命中率、三分球命中率等,以及最后四节的比分。其中,比赛的高潮出现在第19分钟,最终美国队以0.21Cd的微弱优势取胜。文章还提到,比赛过程充满了紧张和激情,德国队在最后时刻做出了有力的反击。

  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • 一季度大赚345亿美元!谷歌CEO称内部超30%的代AI完成

    谷歌母公司Alphabet公布2025财年第一季度财报,营收902.3亿美元同比增长12%,净利润345.4亿美元大增46%,均超市场预期。核心广告和云业务保持强劲增长,YouTube订阅等业务也贡献稳定收入。CEO皮查伊特别强调AI领域突破,Gemini 2.5 Pro获开发者高度认可,AI工具用户数激增200%。公司内部AI辅助代码占比从25%提升至30%,正在研发更先进的AI代理工作流以优化开发效率。受亮眼业绩推动,盘后股价一度涨超5%。

  • 谷歌ai垄断?谷歌每月向三星支付“巨额费用”,让其预装Gemini

    继 Android 系统、Chrome 浏览器等应用之后,谷歌又为他们的 Gemini 预装花费了“巨额费用”……

  • 技术革新下的行业新诞生,坚果N3成4K段位全能投影

    2024年,家用投影行业迎来了里程碑式的革新,坚果投影推出N3系列三款新品。N3UltraMax凭借纯三色激光、真光学变焦、AI全智控云台等核心技术突破,带来了亮度、色彩、智能体验的全面升级,成为万元内投影市场的“性能天花板”,重新定义了家用投影的行业标准。其带来的不仅是销量数字,更是一个行业的价值重构——当“参数内卷”被“体验至上”取代,当“价格战”被“技术战”终结,家用投影产业的黄金时代,或许才刚刚开始。