首页 > AI头条  > 正文

vivo 新多模态模型登场,AI 理解GUI界面能力再升级!

2025-07-10 17:52 · 来源: AIbase基地

近日,vivo AI Lab 发布了其最新的端侧多模态模型 ——BlueLM-2.5-3B。这款模型不仅小巧高效,更具备了理解图形用户界面(GUI)的能力,标志着人工智能在处理文本和图像方面迈出了重要一步。

BlueLM-2.5-3B 的独特之处在于它可以灵活切换长短思考模式,并引入了思考预算控制机制,帮助 AI 更好地平衡思考的深度与效率。这使得该模型在多项文本和多模态评测任务中表现优异,尤其在理解和推理方面,有望超过许多同类产品。

vivo  001

在20余项评测中,BlueLM-2.5-3B 显示出了强大的文本处理能力,成功缓解了多模态模型常见的 “遗忘问题”。在长思考模式下,模型在推理类任务中,如数学和逻辑推理,的表现显著优于其他同规模的模型。此外,其在多模态理解方面也表现不俗,能够与更大规模的模型媲美,体现了它的强大。

不仅如此,BlueLM-2.5-3B 在理解 GUI 方面的表现尤为突出,得益于对大量中文应用程序截屏数据的训练。在这方面,它的得分超过了许多竞争对手,展示了 vivo 在人工智能领域的实力。

为了支撑如此出色的表现,BlueLM-2.5-3B 采用了精巧的模型结构,参数量仅为2.9B,且训练和推理成本相对较低。通过优化的数据利用策略和高效的训练流程,该模型在数据利用效率上有了显著提升,为 AI 的普及和应用打下了坚实的基础。

BlueLM-2.5-3B 的发布不仅为用户带来了更加智能的应用体验,也为人工智能技术的进步增添了新的动力。

  • 相关推荐
  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • vivo X300首发OriginOS 6 韩伯啸:流畅度升级最明显

    vivo产品经理韩伯啸介绍,vivo X300系列出厂搭载全新的OriginOS 6系统,目前OriginOS 6 Beta版本已经推送给X200系列。 韩伯啸介绍,OriginOS 6的体验提升真不少,通知堆叠、音量条设计这次都改到位了,还有大家高度关注的全局直驱供电也上了,打游戏、刷短视频等高频场景全都支持,基本上全场景都适配了直驱供电。他还表示,从我在X300上的体验感知来看,流畅度和设计感可能是这�

  • vivo X300 Pro首发定制2亿灭霸长焦 韩伯啸:长焦新王

    vivo产品经理韩伯啸预热vivo X300系列,今天介绍的是vivo X300 Pro。 韩伯啸表示,X300 Pro独家深度定制了2亿HPB灭霸长焦,是蓝厂实打实的第四代两亿长焦,从X100 Ultra到X200 Pro、X200 Ultra再到如今的X300 Pro,一路迭代升级。 之前在长焦上行业有不同的方案,但现在不少同行都陆续开始跟进2亿高像素长焦,这从侧面说明我们的路走对了,当然现在的2亿有不同的方案,但大家记住选2亿�

  • 亿信华辰连续四年蝉联数据治理解决方案市场第一,AI驱动引领智能治理新时代

    IDC报告显示,2024年中国数据治理市场迎来爆发式增长,规模达376.49亿元。亿信华辰以5.03%的市占率连续四年位居榜首,凭借AI融合能力和行业实践持续领跑。政府与央企成为投入主力,推动数据治理向智能化升级。报告强调AI与Agent技术将成为核心驱动力,建议厂商积极拥抱大模型与智能代理技术,实现数据管理流程自动化。未来,具备AI驱动、实时自适应能力的智能数据治理平台将成为主流。

  • vivo X300 Pro首发全新2亿像素:vivo三星联合打造

    博主数码闲聊站爆料,vivo X300 Pro将首发一颗全新2亿像素潜望长焦,这枚传感器由vivo和三星联合打造,它拥有1/1.4英寸大底,采用VCS仿生光谱技术。 据了解,VCS仿生光谱技术全称是vivo Camera-Bionic Spectrum,其原理是基于对人眼生物视觉系统(Human Vision)的深入研究,采用仿生人视锥细胞色觉的方式改进Color Filter(滤光片),让图像传感器从接收图像信息阶段就具备更好的噪声表�

  • 你的数据该管管了~小鹅通数据权限新升级!请接收你的团队高效管理新方案

    深圳某企业因业务团队间数据权限问题困扰,三条业务线数据共享导致管理困难、效率低下。小鹅通数据权限功能从配置交互优化、应用范围扩大、统一管理平台三方面升级,通过三步流程实现数据与员工精准匹配,提升管理效率与数据安全。

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 2025中秋礼盒璀璨登场 以“好月”传温情 定义团圆新仪式

    2025年8月,三亚万达嘉华酒店及度假村推出“万分好月照人圆”主题中秋礼盒系列,融合传统中式美学与现代味觉体验。礼盒涵盖经典广式月饼、联名定制款及高端食材组合,从味觉到视觉诠释团圆多元内涵。设计匠心独运,采用中国红、鎏金等传统色调,搭配花鸟、玉兔等国风纹样。6款产品满足不同场景需求,价格从188元至888元不等,支持个性化贺卡定制。即日起至10月8日可通过官方渠道购买,传递中秋美好祝愿。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

今日大家都在搜的词: