首页 > AI头条  > 正文

手机跑大模型速度快5倍!微软亚研院开源新技术 CPU上也能享受极速体验

2024-08-09 16:26 · 来源: AIbase基地

在这个智能设备无处不在的时代,我们渴望让手机、平板、甚至是智能家居设备拥有更强大的智能处理能力。但是,这些边缘设备的硬件资源有限,特别是内存和计算能力,这限制了大型语言模型(LLMs)在它们上面的部署和运行。想象一下,如果我们能让这些设备拥有能够理解自然语言、回答问题、甚至进行创作的强大模型,那将会怎样改变我们的世界?

image.png

这就是T-MAC技术诞生的背景。T-MAC,全称"Table-Lookup-based MAC",是一种基于查找表的方法,它能让低比特的大型语言模型在CPU上高效运行,从而实现在边缘设备上的智能升级。

大型语言模型通常包含数十亿甚至数百亿的参数,这些参数需要大量的内存来存储。为了在边缘设备上部署这些模型,我们需要对模型的权重进行量化,即使用更少的比特来表示权重,从而减少模型的内存占用。但是,量化后的模型在运算时需要进行混合精度的矩阵乘法(mpGEMM),这在现有的硬件和软件系统中并不常见,也缺乏高效的支持。

image.png

T-MAC的核心思想是将传统的基于数据类型的乘法运算,转变为基于位的查找表(LUT)查找。这种方法不仅消除了乘法运算,还减少了加法运算,从而大幅提高了运算效率。

具体来说,T-MAC通过以下几个步骤实现:

将权重矩阵分解为多个一位矩阵。

预先计算激活向量与所有可能的一位模式的乘积,并将结果存储在查找表中。

在推理时,通过查找表索引和累加操作,快速得到最终的矩阵乘法结果。

通过在多种边缘设备上的测试,T-MAC显示出了显著的性能优势。与现有的llama.cpp实现相比,T-MAC在吞吐量上提高了4倍,能耗降低了70%。这使得即使是低端设备,如Raspberry Pi5,也能以超过成人平均阅读速度的速度生成令牌。

T-MAC不仅在理论上具有优势,它还具有实际应用的潜力。无论是在智能手机上进行实时语音识别和自然语言处理,还是在智能家居设备上提供更加智能的交互体验,T-MAC都能发挥重要作用。

T-MAC技术为低比特大型语言模型在边缘设备上的部署提供了一种高效、节能的解决方案。它不仅能够提升设备的智能水平,还能为用户带来更加丰富、便捷的智能体验。随着技术的不断发展和优化,我们有理由相信,T-MAC将在边缘智能领域发挥越来越重要的作用。

开源地址:https://github.com/microsoft/T-MAC

论文地址:https://www.arxiv.org/pdf/2407.00088

  • 相关推荐
  • TCL服务破局高温“烤”验,15倍效能守护东北清凉

    东北地区遭遇罕见高温,空调需求暴增22倍。TCL快速响应,组建650名工程师"清凉特攻队",通过全国调配、紧急支援,实现单周安装能力提升15倍。工程师们配备高温防护装备,确保"安装一次到位,清凉即刻抵达"。截至7月中旬,TCL在东北已完成1.5万+空调交付,"TCL速度"和"TCL服务靠谱"成为网络热议话题。行业人士评价:极端天气下淬炼出的服务能力,才是品牌最坚实的护城河。TCL以实际行动践行"为用户提供有温度的家电服务"承诺。

  • 红魔10S Pro系列首发上线PC模拟器:手机秒变PC 离线也能玩

    日前,红魔游戏手机宣布,红魔10S Pro系列首发上线PC模拟器。 官方表示,手机更新至RedMagicOS 10.5.11最新版系统后可体验。 红魔10S Pro系列内置的PC模拟器兼容海量PC游戏,支持离线游玩。 此外,PC模拟器还支持游戏PC画质超分增强、手动更改分辨率,适配手柄/键鼠连接操作、显示器投屏等功能,让手机秒变掌机、PC、主机。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 大模型时代企业查询第一站——水滴信用企业数据查询MCP

    水滴信用推出企业数据查询MCP平台,通过大模型技术实现企业数据查询的智能化升级。该平台整合3.7亿市场主体数据,覆盖工商、司法、知识产权等六大类1000+维度信息,支持自然语言交互和跨域关联分析。目前已应用于银行风控、证券投研、供应链管理等核心场景,显著提升商业决策效率。作为央行备案征信机构,水滴信用凭借权威数据源和专业团队,正推动企业征信服务进入AI普惠时代,降低高价值商业情报获取门槛,促进透明可信的商业环境形成。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 智草与岐黄双模型赋能,APUS医疗MCP服务登陆魔搭社区

    APUS公司宣布其中西医大模型MCP服务正式上线魔搭社区。该服务基于开源通用智能体协议MCP,突破AI模型依赖训练数据的局限,能动态获取上下文信息或执行外部操作。APUS岐黄(西医)和智草(中医)大模型已累计为120万医患提供服务,其中岐黄大模型诊断准确率达92.3%,智草大模型在执业医师考试中展现80.3%的专业水准。此次合作将推动AI医疗技术在更多机构应用,为提升医疗服务质量、改善患者就医体验贡献力量,同时为开发者提供创新可能,预计将在医疗行业掀起新一轮创新应用浪潮。

  • 开源赋能·智领未来 青山工业与深蓝汽车技术开源共享生态建设

    深蓝汽车首创"微核高频脉冲加热技术",有效解决电动车低温续航短、充电慢、动力弱等痛点,加热速率提升200%以上,达到国际领先水平。该技术通过电池内部产生脉冲电流实现自加热,无需额外硬件,已获中国专利金奖。2024年5月,深蓝宣布将相关专利群开源,与青山工业等合作伙伴共建产业生态。实测显示,-30℃环境下电池温升超4℃/min,动力性能提升55%,充电时间

  • 23岁研一男生抗癌4个月后离世:没能陪女友走到最后

    四川一位小伙李歆瑞在抗癌4个多月后离世,年仅23岁。 据了解,李歆瑞今年年初确诊胰腺癌,他一直乐观接受治疗,生活中是个积极开朗的男孩,性格好待人真诚,他最大的遗憾是没能陪女友走到最后。 资料显示,胰腺这个器官深藏于体内,其病变通常难以早期发现,一旦发现往往已经十分严重。 胰腺癌是一组起源于胰腺导管上皮及腺泡细胞的恶性肿瘤,根据肿瘤发生的�

今日大家都在搜的词: