AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

2024-10-01 20:14 · 稿源：快科技

AMD推出小语言模型，赋能企业个性化部署

AMD发布首个小语言模型，增强企业部署灵活性

近日，AMD推出了其首个小语言模型（SLM），名为“AMD-135M”。相较于体积庞大的大语言模型（LLM），AMD-135M更加小巧灵活，并具备针对性，非常适合具有高私密性和专业性的企业部署。

AMD-135M小语言模型概览

AMD-135M小模型属于Llama家族，共有两个版本：

基础型AMD-Llama-135M：拥有6700亿个token，在八块Instinct MIM250 64GB加速器上训练六天。
扩展型AMD-Llama-135M-code：额外增加了200亿个针对编程的token，在相同硬件上训练四天。

推测解码：提升性能，降低内存占用

AMD-135M小模型采用了一种称为“推测解码”的方法。该方法通过较小的草稿模型，在一个前向传播中生成多个候选token，然后发送给更大的、更精确的目标模型进行验证或纠正。这种方法允许同时生成多个token，而不影响性能。此外，它还可以降低内存占用，但由于数据交易量增加，功耗也会随之增加。 AMD利用AMD-Llama-135M-code作为CodeLlama-7b的草稿模型，测试了推测解码的使用效果。

在MI250加速器上，性能提升最高可达2.8倍。
在锐龙AI CPU上，性能提升最高可达3.88倍。
在锐龙AI NPU上，性能提升最高可达2.98倍。

开源资源，促进模型开发

AMD-135M小模型的训练代码、数据集等资源均已开源，遵循Apache 2.0协议。企业和开发者可以根据自己的特定需求和应用场景进行定制和优化。

性能与其他小语言模型的对比

根据AMD的说法，AMD-135M小模型的性能与其他开源小语言模型基本相当或略有领先。在某些任务上，如Hellaswag和SciQ，它甚至超过了Llama-68M和LLama-160M。而在Hellaswag、WinoGrande、SciQ、MMLU和ARC-Easy等其他任务上，其性能与GTP2-124MN和OPT-125M类似。 AMD-135M小语言模型为企业提供了灵活且强大的工具，可以根据其独特需求和业务目标进行定制化部署。其开源特性和与其他模型类似的性能，使其成为企业探索人工智能和语言处理应用的理想选择。

（举报）

相关推荐

关键词：

荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

本期AI日报聚焦多项AI技术突破：智谱发布革命性语音代理AutoGLM 2.0，实现全平台语音操控；腾讯元宝接入视频平台提升观影便捷性；字节跳动开源大模型Seed-OSS专注长文本处理；速卖通AI代理助力新品推广效率翻倍；微软测试Copilot智能文件搜索功能；Liquid AI推出低延迟视觉语言模型LFM2-VL；OpenAI月收入首破10亿美元；谷歌Pixel 10系列全面升级AI功能，包括情感识别和实时翻译；Pixel Buds Pro 2引入AI手势控制；ElevenLabs发布支持70+语言的文本转语音API。

AI产品 AutoGLM 2.0
最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

在最近与科隆国际游戏展同期举办的Devcom开发者大会上，AI再次赚足了脸面。微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题，“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。近年来，游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

AI 游戏美术生产效率
当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

三星One UI 8与Galaxy Z Fold7/Flip7同步亮相，深度融合折叠形态与AI技术，带来全新交互体验。通过与谷歌紧密合作，新系统首批预装Android 16，用户可提前体验最新功能。系统聚焦多模态AI、折叠屏优化UX及个性化设计，并强化安全防护。开发团队透露，三星与谷歌从早期规划便协同开发，实现高效多任务处理与创新功能，未来将继续深化AI生态合作。

Samsung One UI8
小米澎湃OS 3 Beta推送计划发布：首批8月29日起推送看看有你手机没

今日，小米澎湃OS 3正式发布，同时发布Beta版推送计划。据了解，Beta版首批机型将于8月29日开启陆续推送，更多机型将陆续覆盖，具体如下： 8月29日开启陆续推送小米15、小米15 Pro、小米15S Pro、小米15 Ultra、REDMI K80 Pro、REDMI K80至尊版、小米平板7 Pro、小米平板7S Pro 12.5。不晚于9月17日开启推送小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad、小米电视S Pro Mini

小米澎湃OS 3 Beta版推送计划
全球首款防尘折叠屏！谷歌Pixel 10 Pro Fold发布：12900元起

今天凌晨，谷歌新款折叠屏Pixel 10 Pro Fold正式发布，这是全球首款支持防尘的折叠屏旗舰，起售价1799美元（约合人民币12900元）。据悉，谷歌Pixel 10 Pro Fold拥有IP68防护等级，这意味着它能完全防尘防水，谷歌在防护能力方面引领行业。

谷歌Pixel 10 Pro
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
美团发布2025年Q2财报：营收918亿元日订单突破1.5亿

美团发布2025年第二季度及上半年业绩报告，营收918亿元，同比增长11.7%。月活跃用户首次突破5亿，用户年均交易频次创新高。即时零售日订单峰值达1.5亿单，平均配送时间34分钟。CEO王兴表示将持续加大技术创新和生态建设投入，推动可持续发展。截至7月，已联合800多个头部连锁餐饮品牌开设超5500家卫星店，计划年底超1万家。618期间服务超1亿用户，高客单价商品成交额增长2倍。全国建设超5万家闪电仓，助力本地小店数字化转型。

美团财报即时零售用户增长
699元小米智能家庭屏8 云台版正式发布：360°看家、支持微信沟通

今日，小米智能家庭屏8云台版正式发布，售价699元。小米智能家庭屏8云台版搭载500万像素镜头，镜头水平角度360，垂直方向支持上下共30手动调节，搭配F1.6大光圈镜头，官方宣称呈现3K超清画质。该机内置高感光灵敏度图像传感器，微弱光线下也能彩色成像，同时内置红外补光灯，夜视距离10米，无光环境也能清晰成像。小米智能家庭屏8云台版支持AI看护功能，家人、孩�

小米智能家庭屏8 云台版发布 AI看护功能
智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

智谱今天，终于发了AutoGLM2.0。想一想，AutoGLM1.0的版本，距离我第一次首发写他们，已经过去快10个月了。那个时候，他们掀起了一波Agent热潮，甚至连A股都出现了智谱概念股，他们也开启了Agent的另一条支线，用视觉的方式来操控原有设备。当时，我对着我的手机说:我29号要去一趟深圳，你帮我定个罗湖地铁站附近的酒店，预算600元以内，大床房。然后，我的手机，就像

文章搜索核心标签 AutoGLM2.0
小米澎湃OS 3官宣8月28日发布！卢伟冰：顺了不少

今日，小米公司正式对外宣布，将于8月28日15:00举办小米澎湃OS3发布会，此次发布会的Slogan定为“事事顺心”，预示着新系统将为用户带来更加流畅、顺心的使用体验。小米集团总裁卢伟冰通过微博发文表示，小米澎湃OS3是一个全新的起点，团队的目标非常明确——就是要把系统做“顺”。为此，小米组建了一支由产品、研发、测试、质量、市场等多部门联合的精英团队，对8

小米澎湃OS3 发布会用户体验

今日大家都在搜的词：

热文

3 天
7天

AMD发布首个AI小语言模型：6900亿token、推测解码提速3.88倍

AMD发布首个小语言模型，增强企业部署灵活性

AMD-135M小语言模型概览

推测解码：提升性能，降低内存占用

开源资源，促进模型开发

性能与其他小语言模型的对比

荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

当折叠屏遇上AI 探秘开发Samsung One UI 8的幕后故事

小米澎湃OS 3 Beta推送计划发布：首批8月29日起推送看看有你手机没

全球首款防尘折叠屏！谷歌Pixel 10 Pro Fold发布：12900元起

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

美团发布2025年Q2财报：营收918亿元日订单突破1.5亿

699元小米智能家庭屏8 云台版正式发布：360°看家、支持微信沟通

智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

小米澎湃OS 3官宣8月28日发布！卢伟冰：顺了不少

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

小米回应升级Beta后手机很烫：系统编译致短期功耗增加

迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

何小鹏回应小鹏命名：称有人说小鹏改名销量翻倍

站长商机