首页 > 业界 > 关键词  > 面壁智能最新资讯  > 正文

面壁智能开源MiniCPM 2.0系列模型 OCR等能力显著增强

2024-04-15 09:24 · 稿源:站长之家

站长之家(ChinaZ.com) 4月15日 消息:面壁智能最新推出的新一代旗舰端侧模型 —— 面壁 MiniCPM2.0系列模型带来了一系列令人惊叹的性能和功能:

1. MiniCPM-V2.0是端侧最强多模态模型,具有强大的 OCR 能力,甚至部分能力比肩 Gemini Pro。它通过自研的高清图像解码技术,可以准确识别各种复杂的图像内容,包括街景和长图等。

2. MiniCPM-1.2B 是更适配端侧场景的基座模型,性能超越了许多主流模型,包括 Llama2-13B。它的推理速度达到人类语速的近25倍,成本也大幅下降。

3. MiniCPM-2B-128K 是目前最小的长文本模型,可以处理128K(20万字)的文本内容,表现在多维度长文本评测集上表现卓越。

4. MiniCPM-MoE-8x2B 是性能进一步增强的 MoE 架构模型,性能平均提高4.5个百分点,推理成本仅为 Gemini-7B 的69.7%。

微信截图_20240415092804.png

这些新一代的 MiniCPM 模型在不同领域和场景下展现出强大的性能和功能,推动了大模型在端侧应用的进一步发展。同时,面壁智能刚刚完成了新一轮数亿元融资,计划继续面向 AGI 的高效大模型征程,欢迎优秀的人才加入他们的团队。

MiniCPM-V2.0:

https://github.com/OpenBMB/MiniCPM-V

MiniCPM系列开源地址:

https://github.com/OpenBMB/MiniCPM

MiniCPM技术Blog地址:

https://openbmb.vercel.app/?category=Chinese+Blog

举报

  • 相关推荐
  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • REDMI K Pad搭载顶级LCD屏!7大优势全面领先iPad mini

    REDMI K Pad将于本月发布,这是REDMI首款旗舰小平板,号称全面超越iPad mini。 据了解,REDMI K Pad采用8.8英寸3K LCD屏幕,按照REDMI品牌总经理王腾的说法,这块屏幕拥有行业顶级的规格。 王腾还晒出K Pad与iPad mini的屏幕规格对比图,前者无论是ppi、刷新率、全局亮度,还是触控采样率、护眼、湿手触控等,以及屏幕边框,都全面领先iPad mini。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • 卢伟冰:REDMI K Pad对标iPad mini

    REDMI正式官宣其首款旗舰小平板——REDMI K Pad,该产品将于近期发布。与此同时,小米集团合伙人、总裁,国际部总裁,Redmi品牌总经理卢伟冰发文透露,今年堪称小米平板业务的爆发之年,小米平板销量首次跻身全球前三,产品阵容完成换新,全面对标苹果iPad系列产品。 卢伟冰强调,5月发布的小米平板7Ultra直接对标苹果最高端的iPad Pro,而接下来即将发布的新品中,有两款�

  • REDMI电竞小平板即将发布 王腾:对标iPad mini 配置拉满

    日前,REDMI电竞小平板正式入网,预计本月就会与消费者见面。今日,REDMI品牌总经理王腾对外透露,这是REDMI有史以来推出的首款旗舰小平板,其手感极佳,性能强劲,配置更是直接拉满,将全面对标iPad mini。 结合此前爆料信息来看,这款REDMI旗舰小平板亮点颇多。它搭载了一块8.8英寸定制的LCD屏,具备高分辨率与高刷新率,屏幕采用无孔圆角设计,视觉体验值得期待。

  • “当确定要做篮球题材时,我觉得必须是索尼CineAltaV 2和分体Mini来拍了” ---《抓娃娃》摄影指导孙明谈创作心得

    摄影师孙明使用索尼CineAltaV2分体拓展系统Mini拍摄篮球短片《跃界》,展现了该设备的便携性和专业性能。系统采用分体式结构,体积比上一代缩小70%,便于在狭小空间灵活拍摄。配备8.6K全画幅CMOS传感器和9档ND滤镜,能精准控制复杂光线环境。双原生ISO 3200在弱光下表现优异,配合实时可视化监测功能,显著提升拍摄效率。孙明表示,该设备突破了传统器材限制,让创作者能�

  • 揭秘世俱杯定制“看球神器”,RGB-Mini LED如何让老球迷欢乐加倍

    海信推出专为世界杯打造的RGB-Mini LED电视UX系列,带来三大观赛体验升级:1)采用RGB三维控光技术,实现97% BT.2020色域覆盖,配合330Hz高刷,完美呈现HDR10+Live标准赛事画面;2)内置AI体育智能体,提供赛前预测、赛中战术分析和赛后精彩回放等18种智能交互;3)配备6.2.2声道帝瓦雷声学系统,结合AI降噪技术,还原现场氛围。作为国际足联VAR显示合作伙伴,该产品以顶尖技术实力带来身临其境的观赛体验。