首页 > 业界 > 关键词  > 苹果最新资讯  > 正文

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

2024-10-13 11:37 · 稿源: 快科技

科技巨头苹果公司近日宣布推出其最新的多模态人工智能(AI)大模型,命名为“MM1.5”。该模型拥有300亿个参数,是苹果公司在人工智能领域最新突破的标志。

MM1.5构建在MM1架构的基础上,重点关注混合不同类型数据的训练周期对模型性能的影响。该模型提供一系列参数规模,从10亿到300亿不等,并具有图像识别和自然语言推理能力。

与前代相比,苹果公司改进了MM1.5的数据混合策略,从而增强了模型对图像理解、视觉推理和多图像推理任务的能力。此外,苹果公司还引入了高质量的OCR数据和合成图像描述,显着提高了模型对包含大量文本的图像的理解。

除了通用模型之外,苹果公司还推出了专门用于视频理解和移动设备用户界面(UI)理解的MM1.5变体。MM1.5-UI模型未来有望成为iOS背后的苹果“AI”,能够处理各种视觉任务,包括总结屏幕功能和通过对话与用户交互。

虽然MM1.5在基准测试中表现出色,但苹果团队仍在继续优化该模型,以增强其对移动设备UI的理解能力。通过融合更多数据和开发更复杂架构,苹果公司旨在打造一个更高效、更强大的苹果“AI”。

举报

  • 相关推荐
  • 可灵AI O1正式上线:号称全球首个统一多模态视频大模型

    可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指令,实现跨模态内容的高效创作。其技术突破解决了传统视频生成工具功能割裂、操作复杂的痛点,并攻克了视频中主体特征漂移的行业难题,支持长达310秒的自由生成时长。目前用户可通过可灵App及官网体验。

  • 全球首个大一统多模态视频模型可灵O1发布 让P视频像P图一样简单

    全球首个大一统多模态视频创作工具“可灵O1”正式上线。它基于全新视频图像模型,以自然语言为语义骨架,融合视频、图片、主体等多模态描述,将生成和编辑任务整合于一个全能引擎中,为用户提供从灵感到成品的闭环创作体验。该模型打破传统单一视频生成任务边界,支持参考生视频、文生视频、首尾帧生视频、视频内容增删、风格重绘等多种任务,用户无需在多个工具间跳转即可一站式完成全流程创作。

  • 为AI Agent时代筑基,火山引擎多模态数据湖方案重塑数据处理范式

    人工智能时代全球数据量激增,预计2028年将达393ZB,其中80%为非结构化数据。火山引擎推出多模态数据湖方案,以Lance存储+Daft计算为核心,解决数据处理痛点:存储层实现高压缩比与灵活Schema,计算层通过延迟计算提升70%效率。该方案在智能驾驶等场景显著优化性能,端到端处理时间缩短70%,资源利用率提升至95%以上。平台还推出"算子广场"降低开发门槛,并推出Data Agent实现自然语言交互的数据分析,推动企业构建以数据消费为导向的治理体系。

  • 严重落后竞争对手!苹果AI团队重组:找来前微软高管接任

    苹果在AI领域的表现已经严重落后竞争对手,自2024年推出Apple Intelligence以来,其功能表现一直不佳。 前不久苹果宣布AI团队重组,原主管John Giannandrea转任顾问并将于明年初退休,如今苹果找来前微软高层Amar Subramanya接任领导AI团队。 Amar Subramanya是一位印度裔研究员,拥有华盛顿大学博士学位,他加入苹果前,在微软担任AI事业群副总裁四个月,主要负责Microsoft Copilot产品。 �

  • 苹果官网上线“分享正式投诉”页面 可提交苹果AI国行版投诉

    苹果在中国官网上线"分享正式投诉"专属页面,被视为其AI功能即将登陆大陆市场的信号。用户可通过该页面向苹果提交关于Apple Intelligence的正式投诉,公司承诺15个工作日内反馈。此举既为用户提供便捷反馈渠道,也透露出苹果对中国市场的积极准备。据悉,苹果AI国行版将采用百度文心大模型提供技术支持,并引入阿里巴巴的合规审核机制,确保生成内容符合中国法律法规。此前该功能因多种因素延迟上线,现通过投诉页面释放出落地前的重要信号。

  • 小度AI眼镜Pro获评WISE2025年度焦点产品奖,多模态交互定义硬件新形态

    在36氪WISE2025大会上,小度科技CEO李莹以“智能深潜,硬件开始觉醒”为主题,系统阐述了大模型时代智能硬件的演进方向。她强调,场景、AI与硬件的深度融合是破局关键,并以小度AI眼镜Pro为例,展示了“第一视角智能”的创新突破,具备智能构图、防抖、降噪等功能,实现无缝交互体验。同时,小度智能摄像机开创“上帝视角智能”,支持AI随心看护和智能寻物。这些产品背后是全新“超能小度”AI助手,通过多模态交互实现从“能听会说”到“能看会想”的质变。小度宣布为已售设备免费升级,彰显AI普惠决心。小度AI眼镜Pro获“WISE2025年度焦点产品奖”,印证行业对其创新高度认可。

  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • 史上最强!华为Mate X7整机性能提升42%

    今天的华为新品发布会上,余承东宣布华为最新折叠屏手机Mate X7整机性能相比上代Mate X6提升了42%。 作为华为目前最强的折叠屏手机,Mate X7搭载满血麒麟9030芯片,最高提供20GB内存,支持实时光线追踪硬加速。

  • 拒绝做“套金属壳”的伪AI:看“大模型国家队”如何啃下硬骨头

    人工智能成为资本市场热点,随之而来的是鱼龙混杂的乱象。简单包装、打着AI旗号卖高价的“套壳”现象层出不穷。科大讯飞董事长刘庆峰强调,发展人工智能要有长期主义精神,告别“虚火”,把根扎在国产算力的土壤里。下半场比拼的不再是概念堆砌,而是全栈自主可控的硬实力与赋能千行百业的真本事。可靠与安全才是基石,算力是最大瓶颈。企业需构建安全底座并解决真实痛点,才能穿越周期。科大讯飞坚持“顶天立地”战略,既要在源头技术上领先,又要在产业应用上解决民生刚需,展示了AI技术“落地”的正确姿态。

  • 2025年苹果App Store大奖公布 腾讯《无畏契约手游》斩获年度游戏

    日前,苹果揭晓App Store Awards获奖名单,《无畏契约:源能行动》(简称《无畏契约手游》)斩获中国大陆2025年度游戏。 作为苹果每年一度的重磅评选,App Store Awards旨在表彰世界范围内最为杰出的应用和游戏,以向在用户体验、设计和创新方面取得卓越成就的全球开发者致敬。 据了解,《无畏契约手游》由拳头游戏与腾讯光子工作室群联合打造,在保证端游优秀画面表现的�

今日大家都在搜的词: