首页 > 业界 > 关键词  > 苹果最新资讯  > 正文

苹果推出300亿参数多模态AI大模型MM1.5:拥有图像识别、自然语言推理能力

2024-10-13 11:37 · 稿源: 快科技

科技巨头苹果公司近日宣布推出其最新的多模态人工智能(AI)大模型,命名为“MM1.5”。该模型拥有300亿个参数,是苹果公司在人工智能领域最新突破的标志。

MM1.5构建在MM1架构的基础上,重点关注混合不同类型数据的训练周期对模型性能的影响。该模型提供一系列参数规模,从10亿到300亿不等,并具有图像识别和自然语言推理能力。

与前代相比,苹果公司改进了MM1.5的数据混合策略,从而增强了模型对图像理解、视觉推理和多图像推理任务的能力。此外,苹果公司还引入了高质量的OCR数据和合成图像描述,显着提高了模型对包含大量文本的图像的理解。

除了通用模型之外,苹果公司还推出了专门用于视频理解和移动设备用户界面(UI)理解的MM1.5变体。MM1.5-UI模型未来有望成为iOS背后的苹果“AI”,能够处理各种视觉任务,包括总结屏幕功能和通过对话与用户交互。

虽然MM1.5在基准测试中表现出色,但苹果团队仍在继续优化该模型,以增强其对移动设备UI的理解能力。通过融合更多数据和开发更复杂架构,苹果公司旨在打造一个更高效、更强大的苹果“AI”。

举报

  • 相关推荐
  • 苹果M5芯片正式发布:CPU提升15%、图形性能提升30%!

    苹果正式发布了其全新的M5处理器,这款芯片基于台积电的N3P制程工艺,配备了10核CPU和10核GPU。 从CPU来看,M5采用了与M4相同的10核配置,不同的是采用了6个性能核心和4个效率核心,虽然核心数量没有变化,但苹果表示M5的CPU的多线程性能相比M4提高了15%。 在GPU方面,M5配备了10核GPU

  • “大模型应用”新风口:“无人测试”趋势,CIO/CTO如何应对

    当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈,而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试,可提升测试效率300%、降低成本30%,并将产品发布周期从"月"压缩至"周"。这不仅是技术升级,更是重构IT成本结构、实现降本增效的战略支点,助力IT部门从成本中心转型为价值创造中心。

  • 女子徒步误将蛇窝当野生蹦床 耗时1.5小时才脱险

    10月26日,江西上饶的李女士与朋友在擂鼓岭山区徒步时,意外发现一处直径约50厘米的落叶堆积区。该区域地面松软且富有弹性,两人误以为是“天然蹦床”,便多次在上面蹦跳并拍摄视频。然而,危险正悄然逼近——她们随后在附近遭遇两条蛇,其中一条呈棕黑色,形似木棍;另一条头部扁平,符合眼镜蛇的典型特征。两人当即意识到危险,迅速撤离现场。 由于山路崎岖且�

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 荣耀年度旗舰上新,火山引擎助力“YOYO助理”多模态智慧再升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,支持图文、语音、视频输入及多样化内容输出,结合火山引擎的豆包大模型技术,提供联网问答、智能识图、创意修图、出行规划等场景服务,实现“有问必答、答则精准”的智慧体验,成为用户贴身的“万能管家”。

  • 1.5万元LV外套撞衫中学校服:价差超 185 倍

    ​今日,长沙市长郡中学一名学生在社交平台发布对比图,称该校冬季校服设计与奢侈品牌路易威登(LV) 2024 年秋冬系列男士大衣存在高度相似性,引发网友广泛讨论。该学生调侃“长郡版LV联名校服终于来了,这次扳回一局”,相关话题迅速登上本地热搜榜。 据对比图片显示,长郡中学新款校服与LV大衣在版型、配色及细节设计上确有相似之处:两者均采用藏青色为主色调

  • 技嘉发布X3D系列主板:专为AMD X3D处理器打造,游戏性能提升高达25%

    技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板,首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术,通过AI智能场景识别可自动优化处理器性能,游戏性能最高提升25%。主板采用全快易拆设计,配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+,预装网卡驱动实现开机即联网。两款主板均提供4年质保(含1年免费换新),现已在各大电商平台上市。

  • 一加15为何放弃2K屏幕 李杰:165Hz+1.5K是最优解

    一加中国区总裁李杰回答了网友提问,解释了一加15为何放弃2K屏幕而是选择1.5K屏。 李杰解释,我们首先选定165Hz”这个体验更显性的方案,目前的技术限制导致2K和165Hz无法兼得,165Hz 1.5K是当前技术的最优解、最高峰。 受限于发光材料、电路技术等限制,目前整个行业暂时还无法同时做到165Hz 2K的规格,165Hz 1.5K第三代东方屏已经是目前手机屏幕技术的最优解和最高峰。

  • 苹果藏了一手!M5 MacBook Pro隐形升级:SSD速度提升211%

    苹果在前不久正式推出了新款M5 MacBook Pro,不过在外观上缺乏明显变化,可能给人留下了苹果只是升级了M5芯片就完事”的印象。 然而最新的测试显示,其固态硬盘速度也有着大幅提升,对比M4 MacBook Pro,读写速度最高竟提升了211%。 根据Max Tech的对比测试,M5和M4 MacBook Pro在内部布局、单风扇和单热管散热方案上保持一致,都采用了两颗NAND闪存芯片以最大化SSD性能。 不过,在

今日大家都在搜的词: