MiniCPM-V4.0开源发布，堪称“手机上的 GPT-4V”

2025-08-07 09:35 · 来源： AIbase基地

OpenBMB 团队近日宣布，新一代多模态大模型 MiniCPM-V4.0 正式开源发布。该模型凭借其轻量级架构和卓越性能，被誉为“手机上的 GPT-4V”，有望为移动设备上的 AI 应用带来革命性的突破。

MiniCPM-V4.0的核心在于其精巧的设计。它基于 SigLIP2-400M 和 MiniCPM4-3B 构建，参数量仅为 4.1B，却在图像、多图像和视频理解方面展现出强大的能力。这使得它不仅能轻松处理单张图片，还能理解复杂的多图关联内容和视频片段，为用户带来更智能的交互体验。

尽管参数量小，MiniCPM-V4.0的性能表现却令人惊叹。在权威的 OpenCompass 八大主流评测基准上，该模型平均得分高达 69.0，超越了 GPT-4.1-mini 和 Qwen2.5-VL-3B 等一众竞争对手。这一成绩证明了其在视觉理解方面的强大实力，尤其是在处理复杂场景时，其准确性和深度分析能力令人印象深刻。

MiniCPM-V4.0的另一大亮点是其专为移动设备进行的高度优化。在最新的 iPhone16Pro Max 上的实测显示，该模型首次响应延迟不到 2秒，解码速度超过 17token/秒，并且在运行时能有效控制设备发热，确保了流畅稳定的用户体验。此外，它还能处理高并发请求，非常适合在手机、平板电脑等边缘设备上的实际应用。

为了降低开发者的使用门槛，OpenBMB 团队提供了丰富的生态支持。MiniCPM-V4.0兼容 llama.cpp、Ollama 和 vllm_project 等主流框架，为开发者提供了灵活多样的部署选择。团队还专门开发了 iOS 应用，支持在 iPhone 和 iPad 上直接运行，并发布了详细的 Cookbook，提供完整的教程和代码示例。

MiniCPM-V4.0的发布，为多模态技术的应用开辟了新天地。其主要应用场景广泛，包括:

图像分析与多轮对话: 用户可以上传图片，让模型进行内容分析，并在此基础上进行连续对话。
视频理解: 能够分析视频内容，为需要处理视频信息的场景提供解决方案。
OCR 与数学推理: 模型具备识别图片中文字和解决数学问题的能力，大大提升了其在实际工作和学习中的实用性。

MiniCPM-V4.0的开源，不仅展示了国内 AI 团队在轻量级模型研发上的卓越实力，也为全球开发者提供了探索移动端多模态技术的强大工具，为 AI 普惠化迈出了坚实的一步。

Github：https://github.com/OpenBMB/MiniCPM-o

Hugging Face：https://huggingface.co/openbmb/MiniCPM-V-4

ModelScope：https://modelscope.cn/models/OpenBMB/MiniCPM-V-4

CookBook：https://github.com/OpenSQZ/MiniCPM-V-CookBook

相关推荐

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

2025年8月7日，OpenAI正式发布GPT-5，官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升，在AIME2025测试中取得94.6%的高分，处理速度也有明显改善。但与竞争对手相比仍存在差距：Claude4在代码生成和逻辑推理方面表现优异，支持200K token长文本；Gemini2.5具备2M超大上下文窗口和全模态支持；国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�
PENPEN变霸王龙？“侏罗纪世界”热映，名创优品MINISO IP联名产品被抢疯！

名创优品与《侏罗纪世界：重生》联名，推出超50款产品，将电影热度转化为实体商业联动。全球首家主题门店升级，导演加里斯现身引发热议。此次合作通过IP联名产品连接消费者情感，探索兴趣消费新可能，展现中国品牌全球化创新实践。

名创优品侏罗纪世界联名产品
OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

OpenAI发布开源模型系列GPT-OSS，包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构，20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口，支持动态参数调节和任务微调优化，性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能，包括网页交互和Python代码执行，在标准化测试中表现优异。开源策略为开发者提供高性能替代方案，重新定义了AI模型的应用边界。

人工智能开源模型 OpenAI
RAZER发布黑寡妇蜘蛛 V4 矮轴超薄游戏键盘系列

雷蛇发布黑寡妇蜘蛛V4矮轴超薄游戏键盘系列，包含极速版和竞技极速版两款产品。键盘采用全新矮轴机械轴体，触发键程仅1.2mm，配备Razer HyperSpeed无线技术，轮询率1000Hz，支持多设备连接。18.5mm超薄设计搭配人体工学倾斜角度，提供舒适输入体验。键盘采用5052铝合金上盖，内置消音泡棉，按键寿命达8000万次。配备多功能滚轮、专用宏按键和媒体控制键，内置电池续航最高980�

Razer 黑寡妇蜘蛛V4 矮轴键盘
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI发布最强AI模型GPT-5，但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降，且官方突然下架GPT-4o等8个旧模型，导致付费用户抗议。部分用户对旧版产生情感依赖，认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升，但交互体验明显退步。CEO承认低估用户对旧版的喜爱，承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减，面临数据质量和算力成本限制。总体而言，GPT-5在技术指标进步的同时，牺牲了情感交互体验。

GPT-5发布 OpenAI AI模型淘汰
荣耀Magic V5创造吉尼斯世界纪录：成功吊起104kg重物

荣耀Magic V5创造了新的吉尼斯世界纪录，这款折叠屏成功吊起104kg的重物。此前为了展示荣耀Magic V5的强大铰链，该机能吊起75kg重的大沙发，其强度堪称无敌。官方介绍，荣耀Magic V5采用全新荣耀鲁班缓震铰链”，强化内外屏双重防护，成为荣耀迄今抗摔性最强的折叠屏机型，解决折叠屏耐用性痛点。具体来说，荣耀Magic V5采用突破性的技术与材料，应用了荣耀鲁班榫卯式缓

荣耀Magic V5 吉尼斯世界纪录
OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

OpenAI的首席执行官萨姆奥尔特曼（Sam Altman）在近日的一次专访中，透露了下一代大模GPT-6的最新进展。他表示，GPT-6 的开发正在积极推进中，其发布节奏将比从GPT-4到GPT-5的周期更快。奥尔特曼特别强调，GPT-6将不再局限于单纯回答问题，而是朝着与用户深度适配”的方向演进。他举例描述

GPT-6 OpenAI 萨姆奥尔特曼
GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式发布GPT-5，与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出；Claude4Opus编程优异(72.5%)但数学较弱(33.9%)；Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面，GPT-5和Gemini2.5Pro定价相近($1.25-$10)，Claude4Opus较高($15-$75)。建议根据需求选择：GPT-5适合综合应用，Claude4Opus适合专业编程，Gemini2.5Pro适合长文档�

GPT-5发布大语言模型性能对比
荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

《AI日报》精选AI领域最新动态：1)OpenAI发布GPT-5模型，具备强大多模态能力但推理任务仍有局限；2)知网推出AIKBase V2.0多模态数据管理系统；3)Ideogram新增"角色"功能实现图像风格统一；4)Cursor发布CLI版本支持终端AI编程；5)百度即将推出全新推理模型和文心5.0大模型；6)dots.ocr推出1.7B参数多语言文档解析工具；7)特斯拉解散Dojo超算团队转向英伟达合作；8)谷歌Pixel 10引入AI相�

GPT
雷蛇发布幻影战狼V3专业版8K PC专用——专为竞技PC玩家打造的专业无线电竞手柄

雷蛇发布幻影战狼V3专业版8K+PC专用电竞手柄，专为竞技PC玩家打造。该手柄搭载8000Hz轮询率技术、抗漂移TMR摇杆和轻量化无线设计，提供极致速度和精准度。专业版售价1499元，竞技版799元。产品特点包括：可更换摇杆帽、机械触感按键、8向方向键，支持雷云4软件深度自定义。雷蛇表示这是专为PC生态系统打造的专业级手柄，满足电竞选手和硬核玩家对零延迟操控的需求。

8000Hz HyperPolling 抗漂移TMR摇杆

今日大家都在搜的词：

热文

3 天
7天

MiniCPM-V4.0开源发布，堪称“手机上的 GPT-4V”

GPT-5正式发布：与Claude 4、Gemini 2.5等主流大模型谁更胜一筹？

PENPEN变霸王龙？“侏罗纪世界”热映，名创优品MINISO IP联名产品被抢疯！

OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

RAZER发布黑寡妇蜘蛛 V4 矮轴超薄游戏键盘系列

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

荣耀Magic V5创造吉尼斯世界纪录：成功吊起104kg重物

OpenAI CEO：GPT-6将具备个性化记忆记住用户偏好习惯

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

荐AI日报：GPT-5正式发布；百度将推文心5.0大模型；知网发布AIKBase V2.0多模态数据管理系统

雷蛇发布幻影战狼V3专业版8K PC专用——专为竞技PC玩家打造的专业无线电竞手柄

今日大家都在搜的词：

热文

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

黑神话官号更名系列游戏将开启宏大篇章

京东外卖全职骑手破15万人五险一金每人每月平均缴纳约2000元

特斯拉Model 3已标配转向灯拨杆老车主加装拨杆需2499元

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测

苹果正式入驻小红书 iPhone 17系列下月发布

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

站长商机