提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

2023-11-23 13:47 · 稿源：新智元公众号

【新智元导读】最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这个结果表明，统一LLM的输入能让LLM的视觉理解能力提升

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

小米澎湃OS 3 OTA逻辑改进：优先手动检测、逐步放量

今年的小米澎湃OS 3进步很大，流畅性、功能性等多方面都大幅超越前代，很多用户都希望第一时间升级。对此，小米公司应用软件部总监王乐专门发文解释了澎湃OS 3系统改进后的OTA逻辑，让大家更方便体验： 1.在大型软件工程体系下，所有软件产品的新版本发布都会遵循逐步放量的灰度策略 2.灰度策略有多种选择，比如招募一定的内测用户优先推送，或者随机放量慢慢扩�

小米澎湃OS 3 OTA逻辑
特斯拉V14终于来了！整合Robotaxi技术马斯克：FSD有了意识

以下是FSD 14的主要功能更新 1、新增到达选项（Arrival Options）：驾驶者可选择目的地停车类型，包括停车场、街边、车道、停车库或路边停靠。 2、系统可识别警车、消防车、救护车等紧急车辆并自动避让或靠边停车。 3、实现对封路与临时绕行的实时处理。 4、增加自定义速度档位”以调整驾驶风格。新增SLOTH”模式，以更低车

特斯拉 FSD 14
简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

特斯拉在北美推出两款低价入门车型：Model Y标准版起售价39990美元，较原版降价5000美元；Model 3标准版起售价36990美元，降价5500美元。两款车型均为后驱设计，但续航、配置大幅精简：Model Y续航降至321英里，移除全景天窗、氛围灯等功能；Model 3音响系统减配至7个扬声器，取消方向盘电动调节等。特斯拉曾计划推出2.5万美元平价电动车，但已被叫停，资源转向自动驾驶领域。目前中国市场是否引入新车尚未确认。

特斯拉 Model Y
重构想象！KAVA首款全地形车新品亮相，引领行业变革

9月26日，高端全地形车品牌KAVA发布旗舰ATV车型KAVA Strider。该车搭载1000cc发动机，性能领先行业，整车轻量化设计，重量控制在450公斤内，兼具强劲动力与灵活操控。智能系统覆盖驾控、网联和中控三大板块，支持多模式切换、蓝牙/Wi-Fi连接及专属APP，实现地图投屏、无钥匙解锁、电子围栏等功能，提升安全与便捷性。外观灵感源自剑齿虎，线条锐利，造型硬核，重新定义全地形车美学。KAVA Strider不仅是一款产品，更象征行业未来进化方向。

KAVA Strider 全地形车智能系统
GTAOL/GTA增强版万圣节活动月到来！持续时间最长、活动最多、奖励最丰富的狂欢！

GTA万圣节活动月开启，包含三大限时活动：幽浮绑架事件需合作逃脱获专属武器与服装；幽灵曝光任务拍摄新角色杰斯·诺里斯灵魂得奖励；佩里科岛丧尸生存战解锁木乃伊套装。另有UFO观光事件及电棒等限定载具武器。活动持续最长、奖励最丰富，推荐使用加速器优化网络体验。

GTA万圣节活动幽浮绑架事件洛圣都灵异载具
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
iOS 26.1 Beta 2发布：闹钟需要滑动停止、苹果智能支持繁体中文

苹果今天凌晨正式发布了iOS 26.1 Beta 2开发者预览版，加入开发者计划的用户都能升级体验。这次对用户影响最大的是闹钟功能的改进，之前iOS 26将闹钟的停止按钮加大，导致停止更方便，同时也更容易误触，苹果目前已经进行大改，需要滑动才能停止。这个设计让用户在迷迷糊糊中点击手机的无法结束闹钟，不会错过起床时间了。除了闹钟升级之外，Apple Intelligence还在更�

iOS 26.1 闹钟功能改进
数贸会今日开幕！每日互动展台人气火爆，GAI Station引领AI办公新体验

2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司（展位7A-T022）集中展示了AI产业实践与数据流通领域成果，重点推出10万元级智能工作站GAI+Station，集成写作、会议纪要、智能问答等功能，内置8大模型能力，破解成本与安全痛点。其“发数站”战略打通数据高效流通链路，已在医疗、交通等多领域落地，“数智绿波”应用覆盖全国30多个省市，通行效率提升20%以上。此外，AITA超级营销助手实现升级，机器狗互动表演吸引关注。展会期间将举办10余场专业发布，涵盖数据要素、大模型应用等行业实战，助力企业把握数字化机遇。

2025全球数字贸易博览会每日互动 AI产业实践
不让苹果17 Air独美！联想官宣moto X70 Air新机又轻薄又有AI

联想宣布moto X70 Air将于10月底上市，主打“有AI的Air”概念。该机以超薄设计为亮点，背部采用微凸双摄，外观舒适。对比iPhone 17 Air的5.6mm厚度和165g重量，moto新机具体配置未公布，但有望在轻薄度上超越苹果，引发市场期待。

iPhone 17 Air

今日大家都在搜的词：

热文

3 天
7天

提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

小米澎湃OS 3 OTA逻辑改进：优先手动检测、逐步放量

特斯拉V14终于来了！整合Robotaxi技术马斯克：FSD有了意识

简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

重构想象！KAVA首款全地形车新品亮相，引领行业变革

GTAOL/GTA增强版万圣节活动月到来！持续时间最长、活动最多、奖励最丰富的狂欢！

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

iOS 26.1 Beta 2发布：闹钟需要滑动停止、苹果智能支持繁体中文

数贸会今日开幕！每日互动展台人气火爆，GAI Station引领AI办公新体验

不让苹果17 Air独美！联想官宣moto X70 Air新机又轻薄又有AI

今日大家都在搜的词：

热文

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

荣耀Magic8系列暨MagicOS10发布会定档10月15日

11月开启！vivo OriginOS 6公测适配计划公布

iQOO 15搭载自研电竞芯片Q3 能效提升40%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息