首页 > AI头条  > 正文

Meta AI为移动设备开发紧凑型语言模型MobileLLM 仅3.5亿参数

2024-07-09 09:32 · 来源: AIbase基地

Meta AI 研究人员推出了 MobileLLM,这是一种为智能手机和其他资源受限的设备设计高效语言模型的新方法。这项研究于2024年6月27日发布,挑战了有关有效 AI 模型必要规模的假设。

该研究团队由 Meta Reality Labs、PyTorch 和 Meta AI Research (FAIR) 的成员组成,专注于优化参数少于10亿的模型。这只是 GPT-4等模型的一小部分,据估计,GPT-4等模型的参数超过一万亿。

MobileLLM 的主要创新包括:

  1. 优先考虑模型深度而不是宽度
  2. 实现嵌入共享和分组查询注意
  3. 利用一种新颖的直接块权重共享技术

这些设计选择使得 MobileLLM 在常见基准测试任务上的表现比之前类似规模的模型高出2.7% 到4.3%。虽然这些个位数的改进似乎很小,但它们代表了竞争激烈的语言模型开发领域取得的重大进步。

值得注意的是,在某些 API 调用任务上,MobileLLM 的3.5亿参数版本表现出与更大的70亿参数 LLaMA-2模型相当的准确率。这表明,对于某些特定应用,更紧凑的模型可能会提供类似的功能,同时使用更少的计算资源。

image.png

MobileLLM 的开发与人们对更高效的 AI 模型日益增长的兴趣相吻合。随着超大型语言模型的进展出现放缓迹象,研究人员越来越多地探索更紧凑、更专业的设计的潜力。尽管名称中带有“LLM”,但对效率和设备部署的关注使 MobileLLM 与一些研究人员所说的小型语言模型 (SLM)属于同一类别。

虽然 MobileLLM 尚未向公众开放,但 Meta 已将预训练代码开源,允许其他研究人员在其工作的基础上继续研究。随着这项技术的发展,它可能会为个人设备带来更先进的 AI 功能,尽管时间表和具体功能仍不确定。

  • 相关推荐
  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

  • Meta雷朋第三代智能眼镜亮相在即,三星/微美全息领航消费级XR助推行业增长!

    Meta与雷朋合作的第三代智能眼镜渲染图曝光,预计今年发布,定价300-500美元。新一代眼镜强调AI功能升级,支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova,售价约800美元,并配套手势控制腕带。与此同时,三星确认将于9月推出XR头显Project Infinite,售价约1800-2900美元。智能眼镜市场正迎来爆发期,2025年Q1全球出货量激增82.3%,中国增长116.1%。微美全息等企业加速布局,行业期待未来2-3年迎来真正拐点。

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • 8年营收增长77倍,多邻国是如何“硬控”5亿用户?

    就算你没有用过多邻国,也应该见过这只小绿鸟,就在刚刚过去的暑假,瑞幸X多邻国结婚的消息上了N次热搜,从办婚礼、度蜜月、拍短剧、上新品,到蓝V组团“抢婚”、品牌集体“吃席”……各大社交平台,哪哪儿都能见到这个“显眼包”的身影。 这个造型简单的卡通绿鸟,是多邻国官方的品牌符号,中文名字叫“多儿”。很多人看它眼熟,是因为它会蹭且敢蹭——哪里有

  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 小米14无缘澎湃OS 3首批Beta版:张国全解释原因

    小米软件部张国全发文表示,澎湃OS 3 Beta版第二版今天已经外发,欢迎大家升级体验,如果没有重大问题,8款机型第二批Beta版明天逐步外发。 值得注意的是,12306行程助手明天开始外发(澎湃OS 2/OS 3同时外发),NFC上岛/秒表上岛,第一版开始外发,大家升级试用后有问题随时反馈。 张国全还提到了小米14系列Beta版计划,称去年在规划澎湃OS 3 Beta版的时候,怕大家觉得不公�

  • 澎湃OS 3第二批Beta来了!小米回应推送时间

    小米澎湃OS3首批Beta版内测已于8月29日开启推送。 今日,小米澎湃OS官方就大家关心的第二批Beta版(首批Beta版机型)推送时间作出回应。 官方表示,即使推送Beta版本也极为重视交付质量,为了给参与Beta招募的用户提供良好可靠的使用体验,小米社区会按照用户提交招募申请的先后顺序,分两批逐步放量推送,这一举措将提供更充分的质量保障。 当前,由于用户报名热情,�

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • 小米澎湃OS 3首批Beta版正式推送!手机、平板8款机型升级

    根据小米社区网友反馈,小米澎湃OS3首批Beta版内测更新目前已开启推送。 有内测资格用户可以点击手机设置-我的设备-击版本号查看是否收到推送。 升级页面显示,小米15 Pro的澎湃OS3Beta安装包大小7.7GB,小米15 Ultra安装包大小9GB。

今日大家都在搜的词: