首页 > 业界 > 关键词  > 苹果最新资讯  > 正文

苹果大模型MM1入场:参数达到300亿 超半数作者是华人

2024-03-15 14:17 · 稿源:站长之家

要点:

  • 苹果发布了多模态大型语言模型MM1,参数达到300亿,采用MoE架构,超半数作者为华人。

  • MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨,并在多项基准测试中表现出竞争力。

  • MM1的预训练和监督微调结果显示,采用不同的数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。

站长之家(ChinaZ.com)3月15日 消息:苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。

今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这一举措体现了苹果在GenAI领域取得重大进展的决心。据悉,苹果一部分转向GenAI的团队原本是从事造车项目的,而如今他们也开始投身于GenAI领域的研发工作。

image.png

论文地址:https://arxiv.org/pdf/2403.09611.pdf

MM1的发布引起了广泛关注。据论文介绍,该模型采用了MoE变体,并且在预训练指标和多项多模态基准测试上表现出了领先水平。研究者通过多项消融试验,探讨了模型架构、预训练数据选择以及训练程序等方面的重要性。他们发现,图像分辨率、视觉编码器损失和预训练数据在建模设计中都起着关键作用。

在预训练数据选择方面,研究者发现了几个重要经验:交错数据对提高少样本和纯文本性能有帮助,而字幕数据则对提高零样本性能具有重要作用。

此外,纯文本数据对于提高少样本和纯文本性能同样至关重要。通过合理混合图像和文本数据,可以获得最佳的多模态性能,并保留较强的文本性能。研究者还发现,人工合成数据有助于少样本学习。

最终,研究者确定了MM1的最终配方,包括图像编码器、视觉语言连接器和预训练数据的选择。他们还将LLM的大小扩大到3B、7B和30B个参数,并通过专家混合(MoE)进一步扩展了模型。在监督微调实验中,MM1在多项基准测试上表现出了竞争力,并且MoE模型在几乎所有基准测试中均表现优于密集模型。

MM1的发布标志着苹果在多模态领域的重要进展,也为未来苹果可能推出的相关产品奠定了技术基础。该研究的成果对于推动生成式人工智能领域的发展具有重要意义,值得业界密切关注。

举报

  • 相关推荐
  • 中国石油发布3000亿参数昆仑大模型:华为、中国移动、科大讯飞联合打造

    日前,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域迈出关键一步。 据了解,昆仑大模型由中国石油、中国移动、华为、科大讯飞联合打造,2024年8月完成备案,成为中国能源化工行业首个通过备案的大模型。 去年8月28日,330亿参数昆仑大模型发布,11月28日又发布700亿参数昆仑大模型。

  • 李想首次透露理想轿车项目:年度营收3000亿后才去做

    日前,理想汽车管理层在一季度财报电话会上表示,理想焕新版车型上新后,每周销量均超过一万台,5月截至目前在20万元以上市场市占率14.7%,理想有信心焕新版车型很快会回到月销量五万台水平。 针对分析师提出理想汽车在什么阶段会考虑进军轿车市场”的问题。 李想回应称,我们认为,增程SUV、纯电SUV以及理想MEGA全部开启交付后,可以支持理想汽车实现一年3000亿人民

  • 哥哥给妹妹编头发1300多款不重样:一二十分钟搞定

    近日,湖南一则温馨的家庭日常视频在网络上悄然走红。一位哥哥展现出了令人惊叹的编发技能,他每天为妹妹精心编发,且一年多来款式多达300多款且无一重复。 据孩子们的妈妈介绍,哥哥给妹妹编头发这件事已经持续了一年多。每天早上,哥哥只需花费十来二十分钟,就能为妹妹打造出一款别具一格的发型。从简单的马尾辫到复杂的盘发造型,哥哥总能信手拈来,每一次

  • 腾讯《和平精英》重大DMA外挂案告破:抓获4人 涉案金额300

    腾讯游戏安全中心联合宣汉县公安局网安大队破获一起重大游戏外挂案件。犯罪团伙利用DMA技术制作并销售《和平精英》外挂"火神COC",通过特殊硬件工具直接读取修改游戏内存数据,实现透视、自动瞄准等功能。该外挂绕过常规检测手段,取证难度大。警方捣毁多个犯罪窝点,抓获4名嫌疑人,涉案金额超300万元。犯罪团伙通过线上社交平台和境外群组销售外挂,买家遍布全国多地,严重破坏游戏公平竞技环境。

  • 小伙13000元拍下1300年唐朝荔枝树共800斤 家人调侃脑子有病

    近日,来自山东的一男子在京东平台,花了13101元拍下一棵1300年唐朝荔枝树的采摘权。 据了解,这棵1300年古荔枝树来自中国荔枝之乡”广西灵山。 据灵山千年荔枝园负责人介绍,千年荔枝树大概有200多棵”,这棵1300年的荔枝树产量在800斤左右,每年很多游客慕名而来,买去给家人过寿,一般还没结果就被预订光。

  • Labubu在欧美“杀疯了”:3000亿泡泡玛特点燃海外“超级燃料”?

    东南亚的火爆销量还在持续时,泡泡玛特的出海奇迹已经指向下一站:欧美。 “理财产品”Labubu第三代系列发布后,引发全球排队抢购潮,多地限购、断货售罄。 据七麦数据显示,4月25日,泡泡玛特APP首次登顶美国App Store购物榜。近日,蕾哈娜、Lisa、Dua Lipa、贝克汉姆争相晒出自己的Labubu,英国伦敦发生“黄牛斗殴事件”,泡泡玛特已宣布暂停Labubu在英国的销售。

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。

  • 父亲欠债300万儿子拒还 法院判了:需协助偿还借款

    ​5月16日,北京,一起关于遗产继承与债务清偿的案件引发了社会的广泛关注。案件中,一位父亲因生意失败欠下300万元债务后突发心梗去世,其独生子小王继承了父亲的遗产,包括3.6万元的银行存款和一套价值70余万元的房产。面对债权人的催债,小王拒绝偿还父亲的债务,并在法庭上表示:“我爸借的钱凭什么找我要?你们有本事去墓园找他!”然而,法院的判决却让小王的强

  • 真牛人!男子躲深山7年“手搓”300辆车:个个都有创意

    42岁博主顾玉鹏用废弃材料手工打造300辆创意车。2018年创业失败后,他带着3万元进山,每周完成1辆新车制作,材料多为钢筋、二手摩托零件等。代表作包括能爬45度坡的多轮履带车和带折叠床的"水陆两栖打工桌"。他将网友奇思妙想融入设计,如"会飞的垃圾桶"。其短视频账号粉丝近300万,单条最高播放530万次。他要求合作工程师需进山同吃住三个月,以证明普通人也能创造独特物品。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。