首页 > 业界 > 关键词  > 正文

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

2024-10-01 20:14 · 稿源: 快科技
AMD推出小语言模型,赋能企业个性化部署

AMD发布首个小语言模型,增强企业部署灵活性

近日,AMD推出了其首个小语言模型(SLM),名为“AMD-135M”。相较于体积庞大的大语言模型(LLM),AMD-135M更加小巧灵活,并具备针对性,非常适合具有高私密性和专业性的企业部署。

AMD-135M小语言模型概览

AMD-135M小模型属于Llama家族,共有两个版本:
  • 基础型AMD-Llama-135M:拥有6700亿个token,在八块Instinct MIM250 64GB加速器上训练六天。
  • 扩展型AMD-Llama-135M-code:额外增加了200亿个针对编程的token,在相同硬件上训练四天。

推测解码:提升性能,降低内存占用

AMD-135M小模型采用了一种称为“推测解码”的方法。该方法通过较小的草稿模型,在一个前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型进行验证或纠正。 这种方法允许同时生成多个token,而不影响性能。此外,它还可以降低内存占用,但由于数据交易量增加,功耗也会随之增加。 AMD利用AMD-Llama-135M-code作为CodeLlama-7b的草稿模型,测试了推测解码的使用效果。
  • 在MI250加速器上,性能提升最高可达2.8倍。
  • 在锐龙AI CPU上,性能提升最高可达3.88倍。
  • 在锐龙AI NPU上,性能提升最高可达2.98倍。

开源资源,促进模型开发

AMD-135M小模型的训练代码、数据集等资源均已开源,遵循Apache 2.0协议。企业和开发者可以根据自己的特定需求和应用场景进行定制和优化。

性能与其他小语言模型的对比

根据AMD的说法,AMD-135M小模型的性能与其他开源小语言模型基本相当或略有领先。在某些任务上,如Hellaswag和SciQ,它甚至超过了Llama-68M和LLama-160M。而在Hellaswag、WinoGrande、SciQ、MMLU和ARC-Easy等其他任务上,其性能与GTP2-124MN和OPT-125M类似。 AMD-135M小语言模型为企业提供了灵活且强大的工具,可以根据其独特需求和业务目标进行定制化部署。其开源特性和与其他模型类似的性能,使其成为企业探索人工智能和语言处理应用的理想选择。

举报

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 最高提效8倍!腾讯游戏发布专业游戏AI大模型,美术师做动画不用辣么“肝”了

    在最近与科隆国际游戏展同期举办的Devcom开发者大会上,AI再次赚足了脸面。 微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题,“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。 近年来,游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

  • 当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

    三星One UI 8与Galaxy Z Fold7/Flip7同步亮相,深度融合折叠形态与AI技术,带来全新交互体验。通过与谷歌紧密合作,新系统首批预装Android 16,用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计,并强化安全防护。开发团队透露,三星与谷歌从早期规划便协同开发,实现高效多任务处理与创新功能,未来将继续深化AI生态合作。

  • 小米澎湃OS 3 Beta推送计划发布:首批8月29日起推送 看看有你手机没

    今日,小米澎湃OS 3正式发布,同时发布Beta版推送计划。 据了解,Beta版首批机型将于8月29日开启陆续推送,更多机型将陆续覆盖,具体如下: 8月29日开启陆续推送 小米15、小米15 Pro、小米15S Pro、小米15 Ultra、REDMI K80 Pro、REDMI K80至尊版、小米平板7 Pro、小米平板7S Pro 12.5。 不晚于9月17日开启推送 小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad、小米电视S Pro Mini

  • 全球首款防尘折叠屏!谷歌Pixel 10 Pro Fold发布:12900元起

    今天凌晨,谷歌新款折叠屏Pixel 10 Pro Fold正式发布,这是全球首款支持防尘的折叠屏旗舰,起售价1799美元(约合人民币12900元)。 据悉,谷歌Pixel 10 Pro Fold拥有IP68防护等级,这意味着它能完全防尘防水,谷歌在防护能力方面引领行业。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 美团发布2025年Q2财报:营收918亿元 日订单突破1.5亿

    美团发布2025年第二季度及上半年业绩报告,营收918亿元,同比增长11.7%。月活跃用户首次突破5亿,用户年均交易频次创新高。即时零售日订单峰值达1.5亿单,平均配送时间34分钟。CEO王兴表示将持续加大技术创新和生态建设投入,推动可持续发展。截至7月,已联合800多个头部连锁餐饮品牌开设超5500家卫星店,计划年底超1万家。618期间服务超1亿用户,高客单价商品成交额增长2倍。全国建设超5万家闪电仓,助力本地小店数字化转型。

  • 699元 小米智能家庭屏8 云台版正式发布:360°看家、支持微信沟通

    今日,小米智能家庭屏8云台版正式发布,售价699元。 小米智能家庭屏8云台版搭载500万像素镜头,镜头水平角度360,垂直方向支持上下共30手动调节,搭配F1.6大光圈镜头,官方宣称呈现3K超清画质。 该机内置高感光灵敏度图像传感器,微弱光线下也能彩色成像,同时内置红外补光灯,夜视距离10米,无光环境也能清晰成像。 小米智能家庭屏8云台版支持AI看护功能,家人、孩�

  • 智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

    智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。 那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。 当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。 然后,我的手机,就像

  • 小米澎湃OS 3官宣8月28日发布!卢伟冰:顺了不少

    今日,小米公司正式对外宣布,将于8月28日15:00举办小米澎湃OS3发布会,此次发布会的Slogan定为“事事顺心”,预示着新系统将为用户带来更加流畅、顺心的使用体验。 小米集团总裁卢伟冰通过微博发文表示,小米澎湃OS3是一个全新的起点,团队的目标非常明确——就是要把系统做“顺”。为此,小米组建了一支由产品、研发、测试、质量、市场等多部门联合的精英团队,对8

今日大家都在搜的词: