月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级

2025-06-23 08:57 · 来源： AIbase基地

Kimi AI 、月之暗面

近日，国内知名大模型平台 “月之暗面” 正式发布了其开源的多模态模型 Kimi-VL-A3B-Thinking 的最新版本 ——Kimi-2506。这一版本的发布标志着智能体和视觉理解技术的重大进步。

Kimi-2506的开源地址为 [此处插入链接]，而在线演示可在 [此处插入链接] 进行体验。在性能方面，Kimi-2506展现出了更为出色的智能性和节省 token 的能力。在多模态推理的基准测试中，该模型在 MathVision 上取得了56.9的分数，比之前提升了20.1;在 MathVista 上达到了80.1，提升幅度为8.4。其他如 MMMU-Pro 和 MMMU 的得分也有所上升，整体思考长度平均减少了20%，进一步提升了推理效率。

在视觉理解方面，Kimi-2506的能力显著增强，与之前版本相比，其在常规视觉感知任务上的表现也更为优越。例如，在 MMBench-EN-v1.1和 MMStar 的得分分别为84.4和70.4，显示出更全面的视觉理解实力。此外，Kimi-2506支持更高分辨率的图像处理，单张图像的总像素达到320万，相较前一版本提升了四倍。这使得模型在高分辨率感知任务中也取得了可喜的进展。

在应用领域，Kimi-2506在图像理解、图表推理、数学计算、OS 智能体接地、长 PDF 理解和视频分析等多个方面展现了出色的表现。它能够准确识别猫的品种、分析图表中的语义标签、解决数字填空题，并能有效处理长文档的内容。模型还能够将视频拆分为多个场景并提供详细描述。

Kimi-VL-A3B-Thinking 模型由三个主要部分组成:MoonViT 视觉编码器、MLP 投影器和语言模型。MoonViT 能够直接处理不同分辨率的图像，提升了训练效率。MLP 投影器则起到了视觉特征与语言模型之间的桥梁作用，确保了两者的有效结合。而 Kimi 的语言模型则基于 Moonlight，经过大规模的多模态数据和纯文本数据的联合预训练，增强了模型的语言能力与多模态理解能力。

优化方面，Kimi-VL 还采用了增强版的 Muon 优化器，通过引入权重衰减和分布式实现，进一步提高了训练效果与内存使用效率，为模型的性能优化提供了强有力的支持。

开源地址:https://huggingface.co/moonshotai/Kimi-VL-A3B-Thinking-2506

在线demo:https://huggingface.co/spaces/moonshotai/Kimi-VL-A3B-Thinking

划重点:
🌟 Kimi-2506版本的多模态模型在推理效率和视觉理解能力上均有显著提升。
🖼️ 新版本支持更高分辨率图像处理，单张图像总像素提升至320万。
🧠 模型在多个应用领域表现出色，涵盖图像理解、数学计算和视频分析等功能。

相关推荐

2025互联网大会聚焦智能体，微美全息（WIMI.US）多模态AI革新入局抢占Agent赛道

2025年中国互联网大会在北京开幕，聚焦"数驱新质·智创未来"主题，重点探讨AI、5G/6G、低空经济等前沿技术。大会指出AI发展正从大模型转向智能体(AI Agent)时代，微软CEO纳德拉等科技巨头已布局智能体产品。专家分析智能体由"大模型+记忆系统+工具调用+规划能力"构成闭环系统，能自主完成任务并优化结果。微美全息等企业正推进多模态大模型技术重构行业服务模式，构建"技术-产品-行业"一体化生态。行业共识2025年将成为智能体爆发元年，尽管尚处早期阶段，但微软、谷歌、OpenAI等已加速布局，如OpenAI推出的ChatGPT Agent。智能体被视为实现AGI的重要路径，将推动人机协作进入新阶段。

人工智能数字生态产业升级
WAIC2025圆满收官，上海码极客实力呈现多模态世界模型与空间智能技术成果！

上海码极客在WAIC2025展会上展示了四大核心产品线：1）MAGX系列空间智能本体，赋予机器感知与行动能力，其中智能卸货机器人效率提升33%；2）UU系列多模态交互智能体，包括随身AI助手UU Holo和视频分析智能体UU Video Agent；3）工业AI检测产品，如Mini LED AOI和晶圆外观检测设备；4）城市治理空间智能体"悠然智擎"，实现全域感知与智能决策。公司由申恒涛院士领衔，拥有200+自主知识产权，服务500+头部客户，致力于通过空间智能和多模态世界模型技术推动产业智能化升级。

空间智能多模态交互智能检测
ISC.AI 2025智能体驱动产业创新论坛圆满召开

8月6日，第十三届互联网安全大会智能体驱动产业创新论坛在北京召开。论坛汇聚产学研专家，围绕AI技术前沿、智能体研发与产业落地展开研讨，探讨技术创新与产业融合趋势。与会专家指出，智能体发展需兼顾技术突破与安全可控，构建开放协同的产业生态。会议展示了智能体在金融、制造等领域的应用成果，强调技术安全双轮驱动的重要性，呼吁共建智能体发展共同体，推动产业变革。
ISC.AI 2025周鸿祎：应对“超级黑客”威胁安全智能体成破局关键

8月6日，360集团创始人周鸿祎在ISC.AI2025大会上提出"ALL IN AGENT"战略，强调AI时代需要安全智能体应对"超级黑客"威胁。安全智能体以安全大模型为核心大脑，配合工具调用等实操功能，能精准复制人类安全专家能力，实现安全防护从量变到质变的突破。周鸿祎回顾360二十年深耕安全领域的历程，指出当前企业面临安全人才短缺和AI黑客威胁双重挑战。360已实现全线产品智能化，通过自主研发的"智能体工厂"打造安全智能体解决方案，帮助政企单位快速弥补人才短板。安全智能体不仅是传统安全的补充，更是重构数字安全体系的核心力量。
周鸿祎吐槽厂商标榜通用智能体：万能的智能体是不存在的

今日，ISC.AI 2025互联网安全大会开幕式及未来峰会”在北京举行。会上，360集团创始人、ISC大会主席周鸿祎在演讲中表示：现在有很多人就问我，有了智能体是不是就不要大模型了？或者说大模型还没搞懂，怎么又出来智能体了？” 周鸿祎解释，其实这两者不是对立的，应该说智能体包含了大模型，大模型相当于智能体的大脑，智能体相当于大模型的身体。

互联网安全智能体与大模型 ISC.AI大会
荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

《AI日报》精选AI领域最新动态：1)OpenAI发布GPT-5模型，具备强大多模态能力但推理任务仍有局限；2)知网推出AIKBase V2.0多模态数据管理系统；3)Ideogram新增"角色"功能实现图像风格统一；4)Cursor发布CLI版本支持终端AI编程；5)百度即将推出全新推理模型和文心5.0大模型；6)dots.ocr推出1.7B参数多语言文档解析工具；7)特斯拉解散Dojo超算团队转向英伟达合作；8)谷歌Pixel 10引入AI相�

GPT
WAIC 2025 论坛直击 | 超聚变智能体与应用专题论坛圆满召开

7月26日，2023世界人工智能大会(WAIC)在上海世博中心开幕。超聚变作为战略合作伙伴，携FusionOne+AI解决方案亮相，展示从算力底座到行业落地的全栈布局。次日举办智能体与应用专题论坛，发布多项AI实践案例及白皮书，助力企业数字化转型。与会专家指出，AI产业已进入"场景效能竞速"新阶段，正从多维度重构行业逻辑。超聚变提出算力筑基、平台立本、生态聚势的发展

人工智能大会 AI技术融合企业数智转型
三星Galaxy Z系列智能生态体验新篇章多模态AI体验会川渝站开启

7月25日，三星在川渝地区举办Galaxy Z系列新品AI体验活动，展示全新Galaxy Z Fold7和Flip7折叠屏手机。新品搭载多模态AI技术，配备Samsung One UI8系统，通过智能分屏、跨应用分享等功能提升效率。AI助手Bixby支持多语言翻译、解题辅导等场景应用，Galaxy Watch8系列智能手表新增健康监测功能。三星通过硬件创新与AI深度整合，重新定义移动设备交互体验，推动行业进入以人为中心的智能协同新时代。

三星 Galaxy Z系列
周鸿祎：智能体将变成赛博牛马人们可以上班摸鱼

在今日举办的第十三届互联网安全大会（简称ISC.AI 2025）上，360集团创始人周鸿祎在分享自己对未来智能体的看法。周鸿祎表示：未来，智能体将会把活都干了。那人类会干什么呢？人类的工作会变成定义智能体、规划智能体、管理智能体、监督智能体。” 周鸿祎称：智能体变成了我们的赛博牛马，做繁琐的工作、复杂的流程，而人要学会跟它去写作。每个人都能拥有几十�

智能体周鸿祎未来工作
iPhone17 Pro支持8倍光学变焦或迎相机重大升级

近日，有爆料者透露某家电影公司正在制作iPhone17Pro的广告，同时还爆料了这款手机诸多令人瞩目的核心功能与特性。在相机功能方面，iPhone17Pro将迎来显著升级。其中，长焦镜头升级堪称一大亮点，它支持8倍光学变焦，要知道iPhone16Pro仅支持5倍光学变焦，而且能在不同焦距下实现连续光学变焦，这无疑将为用户带来更强大的远距离拍摄能力，仿佛给手机装上了“望远镜”。

iPhone17Pro 相机功能光学变焦

今日大家都在搜的词：

热文

3 天
7天

月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级

2025互联网大会聚焦智能体，微美全息（WIMI.US）多模态AI革新入局抢占Agent赛道

WAIC2025圆满收官，上海码极客实力呈现多模态世界模型与空间智能技术成果！

ISC.AI 2025智能体驱动产业创新论坛圆满召开

ISC.AI 2025周鸿祎：应对“超级黑客”威胁安全智能体成破局关键

周鸿祎吐槽厂商标榜通用智能体：万能的智能体是不存在的

荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

WAIC 2025 论坛直击 | 超聚变智能体与应用专题论坛圆满召开

三星Galaxy Z系列智能生态体验新篇章多模态AI体验会川渝站开启

周鸿祎：智能体将变成赛博牛马人们可以上班摸鱼

iPhone17 Pro支持8倍光学变焦或迎相机重大升级

今日大家都在搜的词：

热文

李想回应理想被黑：知道是谁干的背后有专业水军

AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKB

小米智能摄像机4C 3.5K发布：支持600万像素售价199元

荣耀畅玩70 Plus开售：售价1199元起电池耐用5年

iQOO Z10 Turbo+首销战绩公布：为Z10 Turbo Pro的174%

微信内存一下就少了10G上热搜无需担心误删重要资料

iPhone17系列仅标准版没涨价分析师称Pro机型将上调50美元

AI日报：阿里推全新图片模型Qwen-Image；小米全量开源MiDashen

海底捞回应“改为半自助模式” 客服辟谣：系不实传闻

AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌

苹果iOS 26 Beta 5上线：细节优化更新内容一览

AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm

第五人格崩了上热搜网易旗下多款游戏回应：紧急排查中

理想i8宣布统一版本：标配即顶配并降价1万元

荣耀Magic7 Pro 16+512G卫星通信版开售：售价5199元

站长商机

​月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级

今日大家都在搜的词：

热文

站长商机

月之暗面开源 Kimi-2506：多模态智能体，视觉理解能力重大升级