首页 > 业界 > 关键词  > 正文

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

2024-10-01 20:14 · 稿源: 快科技
AMD推出小语言模型,赋能企业个性化部署

AMD发布首个小语言模型,增强企业部署灵活性

近日,AMD推出了其首个小语言模型(SLM),名为“AMD-135M”。相较于体积庞大的大语言模型(LLM),AMD-135M更加小巧灵活,并具备针对性,非常适合具有高私密性和专业性的企业部署。

AMD-135M小语言模型概览

AMD-135M小模型属于Llama家族,共有两个版本:
  • 基础型AMD-Llama-135M:拥有6700亿个token,在八块Instinct MIM250 64GB加速器上训练六天。
  • 扩展型AMD-Llama-135M-code:额外增加了200亿个针对编程的token,在相同硬件上训练四天。

推测解码:提升性能,降低内存占用

AMD-135M小模型采用了一种称为“推测解码”的方法。该方法通过较小的草稿模型,在一个前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型进行验证或纠正。 这种方法允许同时生成多个token,而不影响性能。此外,它还可以降低内存占用,但由于数据交易量增加,功耗也会随之增加。 AMD利用AMD-Llama-135M-code作为CodeLlama-7b的草稿模型,测试了推测解码的使用效果。
  • 在MI250加速器上,性能提升最高可达2.8倍。
  • 在锐龙AI CPU上,性能提升最高可达3.88倍。
  • 在锐龙AI NPU上,性能提升最高可达2.98倍。

开源资源,促进模型开发

AMD-135M小模型的训练代码、数据集等资源均已开源,遵循Apache 2.0协议。企业和开发者可以根据自己的特定需求和应用场景进行定制和优化。

性能与其他小语言模型的对比

根据AMD的说法,AMD-135M小模型的性能与其他开源小语言模型基本相当或略有领先。在某些任务上,如Hellaswag和SciQ,它甚至超过了Llama-68M和LLama-160M。而在Hellaswag、WinoGrande、SciQ、MMLU和ARC-Easy等其他任务上,其性能与GTP2-124MN和OPT-125M类似。 AMD-135M小语言模型为企业提供了灵活且强大的工具,可以根据其独特需求和业务目标进行定制化部署。其开源特性和与其他模型类似的性能,使其成为企业探索人工智能和语言处理应用的理想选择。

举报

  • 相关推荐
  • AI介入私域运营,不仅提效,还省90%的token

    这样的做法既融入了原有的工作流,又将AI的token消耗压缩90%。类似需要“被动回复”的环节都可以用AI客服来完成。

  • AMD RX 9060 XT 8GB不会取消!与16GB版本还是同天

    快科技5月2日消息,根据最新消息,AMD仍将推出8GB版本的Radeon RX 9060 XT显卡,并且该版本将与16GB版本在同一天上市。此前,市场上曾有传闻称AMD可能会取消8GB版本的RX 9060 XT,或者仅为其分配有限的产能,但根据BenchLife的报道,这些传闻并不属实。BenchLife指出,AMD不太可能在产品尚未推出之前就停止供货或取消,因为其AIB合作伙伴已经备货并开始生产。因此在开卖初期,RX 9060 XT的16GB和8GB版本都会同时出现在市场上。不过,后续AIB合作伙伴会根据市场销售情况对产品进行调整,预计16GB版本的市场需求可能会大于8GB版本。从市场反

  • 《唐探1900》票房破36亿 位居中国影史第14

    截至4月26日,《唐探1900》票房突破36亿,位列中国影史票房榜第14名,超越《消失的她》和《热辣滚烫》。目前距离第13名《红海行动》仅差5200万。该片自春节档上映后已三次密钥延期,最新延期至5月31日。凭借持续上映优势,未来一个月内其排名有望进一步提升。

  • 微星1250W/1000W电源首发享百元优惠 RTX 50/AMD 9000系显卡必备

    微星(MSI)近日发布了两款全新电源产品——MPGA1250GS PCIE5 暗黑(1250W)和MPG A1000GS PCIE5 暗黑(1000W),专为适配新一代显卡(如NVIDIA RTX 50 系列、AMD RX 9000 系列)及高性能计算需求设计。这两款电源凭借前沿技术、高效能表现与人性化设计,重新定义了高端电源的标准,为游戏玩家和内容创作者提供了可靠的电力保障。核心亮点解析1.ATX 3. 1 与PCIe 5. 1 原生支持两款电源严格遵循

  • 全系标配四轮转向!智己L6开卖48小时预定破9000

    华为4月21日发布全新MateBook L6,性能配置提升明显,官方数据显示其运行速度比上一代提升了约30%。设计上采用窄边框,屏幕刷新率高达90Hz。通过优化散热系统,最高可实现220km/h的极速。在屏幕方面,MateBook L6采用3D触控屏,分辨率达到379ppi,色彩饱和度最高可达2.74JNCD。在显示效果上,这款笔记本电脑在对比度方面表现优秀,单次充电续航可达690km或850km。九号屏幕版本在运行速度方面比上一代提升了约30%,最高可实现100km/h的极速。MateBook L6在电池容量上提供93Wh或100Wh的电池选项,CLTC续航模式下最长可达780km。

  • 九为健康联合华为云发布神农中医大模型智能体,解码如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • 解码Z世代AI使用场景:Soul发布用户行为研究报告

    Soul App旗下Just So Soul研究院发布的《2025Z世代AI使用报告》显示:Z世代已成为"AI原住民",95%年轻人习惯用AI辅助工作学习,05后高频使用占比达62.5%。AI显著提升效率,近八成年轻人认为工作效率提升超50%。在情感领域,超四成年轻人每天使用AI获得情感陪伴,71.1%愿与虚拟人做朋友,平均每人拥有1.8个AI伙伴。尽管存在隐私安全等"AI焦虑",但年轻人积极应对:59.2%看到AI催生新职业的潜力,19.9%已通过AI创收。报告展现了Z世代与AI的深度共生关系,AI正重塑其工作、情感与经济价值创造方式。

  • AMD中国特供RX 9070 GRE突袭上架!4199元起、5月8日开售

    AMD意外在中国首发RX 9070 GRE显卡,将于5月8日正式上市。该卡采用Navi48XL核心,48个CU单元,3072个流处理器,显存从16GB缩减至12GB,位宽降至192-bit。起售价4199元,最高4499元。性能方面,游戏频率2220MHz,加速频率2790MHz,比RX 9070提升150/270MHz。AMD称其在1440P超高设置下比RX 7900 GRE快6%,定位介于RX 9070和RX 9060XT之间,对标NVIDIA RTX 5070,同时压制RTX 5060Ti。

  • 迎战AMD RX 9060 XT!曝RTX 5060在5月19日上市:2499元起你买吗

    英伟达计划5月19日发布RTX 5060显卡,恰逢台北电脑展前夕。该卡采用GB206 GPU,拥有3840个CUDA核心、8GB显存和128-bit位宽,相比RTX 4060性能提升显著:CUDA核心增加25%,显存带宽提升65%,频率升至28Gbps,功耗145W。建议零售价2499元,比前代贵100元。值得注意的是,评测解禁与发售同步进行,消费者无法提前获取独立评测数据。此外,AMD也将在同期发布RX 9060XT显卡,与RTX 5060形成直接竞争。

  • 90后独臂外卖小哥入职京东 回应:11天收入4900

    安徽90后独臂外卖小哥常文亮转行成为京东全职骑手引发关注。他透露此前在美团月收入约7500元,加入京东外卖仅11天就赚取4900元。更令他欣慰的是,下月起京东将为他全额缴纳五险一金,这让他感受到更好的生活保障。常文亮通过抖音分享转型经历,表示对新工作的福利待遇感到惊喜。京东外卖自2月11日上线后,3月1日起为全职骑手全额承担五险一金费用,成为首个提供全面保障的外卖平台。这一举措既体现了企业对骑手的关怀,也为行业树立了新标杆。