首页 > 业界 > 关键词  > MiniGPT4-Video最新资讯  > 正文

AI视频理解,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝

2024-04-07 13:47 · 稿源: 新智元公众号

【新智元导读】秒懂视频的AI诞生了!KAUST和哈佛大学研究团队提出MiniGPT4-Video框架,不仅能理解复杂视频,甚至还能作诗配文。几天前,OpenAI官方账号发布了第一支由Sora制作的MV——Worldweight,引全网围观。AI视频,已然成为多模态LLM发展的大趋势。然而,除了视频生成,让LLM对

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 实测Gemini 3 Pro - 此即未来。

    经过238天等待,Gemini 3 Pro正式上线。在多项基准测试中表现惊人:Humanity's Last Exam测试达45.8%,Math Arena Apex获23.4分,ScreenSpot-Pro界面识别达72.7%。其前端代码能力尤为突出,仅用几十秒就能生成完整网页音乐播放器、像素画板,甚至成功复刻出可运行的Web OS系统。目前该模型在各大竞技场排行榜均位列第一,堪称2025年最具突破性的大模型。

  • 谷歌发布Gemini 3 数学能力堪称全球最强

    谷歌正式推出新一代推理模型Gemini 3.0 Pro,在各大评测榜单表现优异:LMArena竞技场以1501分登顶,数学基准测试达23.4%远超同行,编程能力稳居第一梯队,视觉理解准确率高达72.7%达现有水平两倍。该模型基于自研TPU训练,配套发布Agentic编程平台Antigravity,支持多步骤复杂流程自主执行(如智能整理收件箱)。目前通过Gemini应用、AI Studio及API向各类用户开放。

  • AI日报:谷歌Gemini 3 Pro Preview模型上线;Cloudflare文件异常致全球宕机;百度Q3 AI收入96亿元

    谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。

  • SSS级战斗天使!vivo S50 Pro mini官宣首批搭载第五代骁龙8:跑分超300万

    根据官方预约界面显示,vivo S50系列确定将在12月发布,近期官方也已经陆续开启预热。 刚刚,vivo产品经理韩伯啸发文确认系列保留了Pro mini机型,并且官宣该机将首批搭载第五代骁龙8。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 视觉暴击!海信RGB-Mini LED电视乌镇实测《黑神话》,拉满沉浸感

    在2025世界互联网大会乌镇峰会上,海信与《黑神话:悟空》合作展示RGB-Mini LED电视技术,精准还原游戏画面细节,如武器光泽、服饰纹理,引发玩家排队体验。该技术突破传统显示方案,通过RGB三原色发光芯片实现100% BT.2020色域和108bits控光精度,消除色彩失真,呈现“真、纯、透”视觉效果。海信E8S Pro作为代表机型,凭借12项影音优化功能,成为体验3A大作的理想设备,彰显“好游戏+好设备”的双重魅力。

  • AI日报:xAI推出Grok 4.1;OceanBase发布首款AI数据库seekdb;Kimi K2成功接入Perplexity

    本期AI日报聚焦多项技术突破:蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用;xAI推出免费Grok 4.1模型显著提升质量与速度;Poe推出200人群聊功能支持多模型协作;OceanBase发布首款AI数据库seekdb实现混合搜索;国产模型Kimi K2接入Perplexity展现国际竞争力;谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%;ElevenLabs升级为一站式内容生成平台;昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite,用户拍照即可自动完成任务。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • iPad mini 8外观巨变:去掉扬声器开孔

    iPad mini 8将采用全新设计,去掉扬声器开孔并提升防水性能,同时苹果也在为iPad mini 8研发一套新的扬声器系统。 据悉,iPad mini 8可能采用屏幕激励器方案,通过驱动屏幕振动来发出声音,其原理是将振动机械能直接传输到屏幕,然后让屏幕代替传统扬声器振膜发声。 具体来说,它是通过在机身内部的微驱动单元(激励器)来激励中框 ,从而带动屏幕振动发声。

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

今日大家都在搜的词: