首页 > 业界 > 关键词  > SliceGPT最新资讯  > 正文

微软开发新型大模型压缩方法SliceGPT

2024-01-29 16:57 · 稿源:站长之家

站长之家(ChinaZ.com)1月29日 消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。

这意味着使用SLICE GPT的模型可以在更少的GPU上运行,并且运行速度更快,无需任何额外的代码优化。在24GB的消费级GPU上,将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

image.png

论文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题,并提供了一种有效减轻这些资源需求的方法,同时保持或仅轻微牺牲模型性能,这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说,SLICE GPT能够减少大型语言模型的尺寸,通过在不损失显著性能的前提下,减少模型参数数量,SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率,减少了所需的计算资源,并且能够在去除一定比例的模型参数的同时,保持模型的性能。此外,SLICE GPT不仅适用于特定的模型或架构,它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案,通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵,通过将模型中的每个权重矩阵替换为一个更小的(密集的)矩阵来减少网络的嵌入维度,有效地缩减了模型的大小。

其次是维持计算不变性,SLICE GPT引入了变换器网络中的“计算不变性”概念,通过特定的变换操作,改变权重矩阵的形状,而不改变其在模型中的功能和影响,从而达到减少模型参数的目的,同时保持模型的性能。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。

举报

  • 相关推荐
  • Matrixport 旗下 Cactus Custody 与 OnChain 合作,完成招银国际美元货币市场基金化上链

    新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作,将招商国际美元货币市场基金以化形式上链运营,成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点,通过链上净值计算、白名单管理等机制,为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作,推动RWA标准化发展。

  • 红魔11 Ultra曝光:首款支持主动散热的骁龙8 Elite 2旗舰

    红魔11 Ultra现身Geekbench跑分网站,首发搭载骁龙8 Elite 2旗舰平台,单核3309分、多核10742分。该芯片采用8核设计,集成Adreno 840 GPU,博主透露量产版频率将提升至4.6GHz左右。新机延续主动散热风扇设计,支持IP68防尘防水,是行业内唯一支持防水的主动散热手机,通过高效散热保证处理器性能稳定释放。新品预计今年第四季度发布。

  • 荣耀Magic V Flip2发布:售价5499元起

    昨日晚间,Magic V Flip2正式发布,这款被荣耀视为最强小折叠的产品,凭借全方位的升级与出色的配置,一经亮相便吸引了众多消费者的目光。 在售价方面,荣耀Magic V Flip2提供了多个版本供消费者选择。其中,12GB +256GB、12GB +512GB和12GB +1TB版本售价分别为5499元、5999元和6499元;高定款(16GB +1TB)售价为7499元。该机型提供钛空灰、月影白、晨曦紫等丰富配色,高定款则采用独特的�

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 荣耀Magic V Flip2官宣:背板采用独特工艺 璀璨星空设计

    今日,荣耀正式对外官宣了新一代小折叠旗舰——荣耀Magic V Flip2,瞬间吸引了众多数码爱好者的目光。不过,官方目前尚未公布该机的具体发布时间,但提前晒出了新机外观图,让大众得以一窥其背板设计的独特魅力。 此次荣耀Magic V Flip2再度携手Professor Jimmy Ch oo周仰杰博士精心打造。据介绍,从设计细节来看,每一处都精准到毫米,尽显优雅气质;每一次开合手机,都仿佛能

  • 来京东先人一步入手荣耀Magic V Flip2高定款 800台现货抢先发

    荣耀Magic V Flip2于8月21日发布,售价5499元起,8月28日开售。京东联合荣耀推出“先人一步加速换新计划”,提供限量800台高定款现货抢购。预购可享多重权益,包括30天意外换新、视频会员、萌宠礼盒等四选一。参与预购还可享国补立减500元、12期免息、以旧换新至高补贴1100元等福利。高定款另赠JIMMY CHOO亲签明信片及香水。新机搭载第三代骁龙8芯片、5500mAh电池,支持80W有线及5

  • 苹果首款折叠iPhone细节曝光:支持eSIM、Touch ID回归

    日前,知名科技记者马克古尔曼(Mark Gurman)曝光苹果首款折叠iPhone更多细节。 古尔曼透露,苹果折叠iPhone将配备四颗镜头,分别是外屏前摄、内屏前摄,以及两颗后摄。 另外,新款iPad Air、iPad mini和入门级iPad机型均配备了Touch ID电源键,这一功能可能会延续到折叠iPhone上,而非目前iPhone所使用的面部识别(Face ID)技术。

  • 一图读懂荣耀Magic V Flip2:荣耀最强小折叠 5499元起

    今晚,荣耀Magic V Flip2正式发布,起售价是5499元。 荣耀Magic V Flip2全系搭载精研雾面金属中框,机身展开状态下薄至6.9mm,折叠状态下薄至15.5mm,重约204g,一手可握。 影像上,荣耀Magic V Flip2配备了竖折首款2亿超清写真镜头,拥有1/1.4超大底传感器和2.24m等效大像素,轻松放大高清真实美,搭配50

  • 内外双屏 随心定义 快用Good Lock“打扮”你的三星Galaxy Z Flip7

    三星Galaxy Z Flip7折叠屏手机凭借精致设计和出色体验获得消费者青睐。文章重点介绍了通过"Good Lock"应用深度定制手机的方法:1)Home Up和主题公园提供主屏幕布局和主题综合定制;2)LockStar可自定义锁屏界面,添加常用APP快捷入口;3)Keys Cafe打造个性化键盘效果;4)ClockFace为外屏时钟添加文字/图片/GIF动图;5)MultiStar新增FlipShot功能,为自拍用户提供动态背景特效。这些工具让用户能根据个人喜好,从界面布局到细微功能进行全面定制,将手机打造成彰显个性的专属设备。

今日大家都在搜的词: