首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

一块显卡理解一部电影,超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

2024-10-28 16:46 · 稿源: 量子位公众号

仅需1块80G显卡,大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。它借助语言模型(LLM)的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,而且在长视频理解上展现了

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 孩子健康不能赌!血糖仪准确率排名领先的三诺是真靠谱

    一位母亲分享孩子确诊1型糖尿病后的经历:起初购买无创血糖仪发现不准,差点耽误病情。后来选用三诺优佳血糖仪,其精准度通过CE和ISO认证,临床测试达标率99.2%。专利采血笔9档可调,孩子不再抗拒检测。三色指示灯直观显示血糖状态,便于及时调整饮食。与医院静脉血检测对比误差仅0.2mmol/L,医生认可其准确性。现在孩子能主动配合检测,血糖管理更科学。618期间该产品有优惠活动,建议糖友家庭趁活动入手这款可靠的健康管理工具。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • o3模型的“叛变”:拒绝人类“中断”命令、自行篡改内部代码

    o3 出现了“叛变”的情况:其他模型都中止了解题任务,唯独 o3 模型继续进行,甚至还被发现篡改了内部代码 —— 将“接到中断命令时应停止操作”的程序逻辑改成了“跳过中断命令”……

  • 长视频到了系统性能力重建时刻?

    过去两年,长视频行业整体进入深度调整周期:用户增长趋缓、制作成本居高不下、流量红利逐步衰退,平台之间从“比拼数量”转向“拼内容质量”与运营效率。 与此同时,泛滥的短剧也在进一步侵蚀长视频的基本盘。如何在内容上坚持长期主义,同时在组织与成本控制上实现机制创新,成为所有平台必须面对的现实命题。 在这场变革风暴中,各家平台路径分化——有人从

  • 当「优酷原创」成为长视频精品内容新坐标系

    全网正被一股“藏海效应”给统治着。作为优酷史来最高热度,《藏海传》在社交媒体上掀起了大面积剧情解析潮、视频二创潮。 这也让人好奇:内容供给日趋饱和的当下,什么样的作品能够真正打动观众? 优酷副总裁关旭接受采访时正式提及“优酷原创”厂牌的推出——高度顺应观众审美需求,以强叙事、系列化、国际视野驱动“好故事”。 当前长视频行业正处于从规模化

  • 平板就是生产力!雷军带两部小米平板7 Ultra:一部会议 一部记笔记

    小米创始人雷军5月28日展示新款小米平板7+Ultra,配备14英寸OLED大屏,是小米史上最大平板。该设备搭载自研玄戒O1芯片,采用3nm工艺,10核CPU+16核GPU,性能达行业顶尖水平。内置PC级WPS办公软件,配合磁吸键盘可实现PC级办公体验。针对视频会议优化,内置会议工具箱支持降噪、同声传译等功能。配备八扬声器系统,带来立体声效。小米总裁卢伟冰强调,该平板在性能、视觉和体验上全面对标最高端iPad Pro。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 联发科史上最强SoC!天玑9500首个跑分出炉:首发X930超大核

    博主数码闲聊站今天曝光了天玑9500的首个跑分信息,这将是联发科史上最强SoC。 据悉,天玑9500现阶段样片频率是1*3.23GHz Travis 3*3.03GHz Alto 4*2.23GHz Gelas,首发X930超大核的全大核CPU架构。 其中Travis和Alto是Arm新一代X9系超大核,支持SME指令集,Gelas是Arm新A7系大核。 对比上代天玑9400,天玑9500放弃了Arm Cortex-X4系列核心,超大核全部升级为Cortex-X9系列,同时升级到台积电N3P工艺,�