微软开发新型大模型压缩方法SliceGPT

2024-01-29 16:57 · 稿源：站长之家

站长之家（ChinaZ.com）1月29日消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT，可以在保持99%，99%，和90%零样本任务性能的同时，将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数（包括嵌入）。

这意味着使用SLICE GPT的模型可以在更少的GPU上运行，并且运行速度更快，无需任何额外的代码优化。在24GB的消费级GPU上，将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

论文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题，并提供了一种有效减轻这些资源需求的方法，同时保持或仅轻微牺牲模型性能，这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说，SLICE GPT能够减少大型语言模型的尺寸，通过在不损失显著性能的前提下，减少模型参数数量，SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率，减少了所需的计算资源，并且能够在去除一定比例的模型参数的同时，保持模型的性能。此外，SLICE GPT不仅适用于特定的模型或架构，它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案，通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵，通过将模型中的每个权重矩阵替换为一个更小的（密集的）矩阵来减少网络的嵌入维度，有效地缩减了模型的大小。

其次是维持计算不变性，SLICE GPT引入了变换器网络中的“计算不变性”概念，通过特定的变换操作，改变权重矩阵的形状，而不改变其在模型中的功能和影响，从而达到减少模型参数的目的，同时保持模型的性能。这种方法的核心优势在于，它允许模型在去除一定比例的参数后，仍然能够保持接近原始模型的性能，适用于资源受限的设备上部署大型模型，比如普通的个人电脑或者移动设备。

（举报）

相关推荐
大家在看

关键词：

SliceGPT

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

让大模型直接操纵格斗游戏《街霸》里的角色，捉对PK，谁更能打?GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中，两个大模型分别输出答案，再由人类评分不同——街霸Bench引入了两个AI之间的交互，且由游戏引擎中确定的规则评判胜负。正如开发者所说，想要赢，要在速度和精度之间做好权衡。

GPT-4 Benchmark
月之暗面：Kimi 大模型API 已支持 Tool Calling 功能

月之暗面宣布Kimi大模型学会了使用工具，即API已支持ToolCalling功能。通过这个功能，开发者可以让Kimi大模型与各种自定义外部工具进行交互，从拓展AI应用的想象空间。月之暗面表示，随着外部工具调用能力的提升，基于大模型的AIAgents应用将进入新阶段，为用户带来更多可能性，从聊天对话到完成各种任务，融入用户实际工作流程。
荐微软开源最强小参数大模型—Phi-3 Mini

4月23日晚，微软在官网开源了小参数的大语言模型——Phi-3-mini。Phi-3-mini是微软Phi家族的第4代，有预训练和指令微调多种模型，参数只有38亿训练数据却高达3.3Ttokens，比很多数百亿参数的模型训练数据都要多，这也是其性能超强的主要原因之一。Phi-3-medium的性能可媲美Mixtral8x7B和GPT-3.5，资源消耗却更少。

微软
荐发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

【新智元导读】前段时间，微软公布并开源了最新一代大模型WizardLM-2，号称性能堪比GPT-4。还未上线一天，模型权重和公告全被删除了，原因竟是......上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待，微软团队承诺，会在测试完成后重新上线。

GPT-4 WizardLM-2
音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型今日启动邀测

4月2日，昆仑万维AI音乐生成大模型「天工SkyMusic」即日起面向社会开启免费邀测。昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”，成为AI行业全新里程碑。未申请邀测的用户也可在4月17日免费下载最新版“天工AI智能助手”APP，感受「天工3.0」与「SkyMusic」带来的颠覆性AI体验。

AI音乐生成大模型昆仑万维
微软紧急撤回最先进的AI大模型：居然忘了测试了

Meta发布超级彪悍的大语言模型Llama3之后，微软也很快推出了自己的新一代WizardLM28x22B，号称迄今最强大，完全超越Claude3OpusSonnet、GPT-4等竞品开源，但是马上又把它撤回去了。没有任何征兆，微软就删除了WizardLM2大模型的相关文件、代码一直没有任何公开解释。大模型幻觉产生的原因有很多，训练数据、预训练和对齐阶段、推理阶段都会出现缺陷。

大语言模型 WizardLM2 微软
股价飙升！商汤大模型挑战GPT4

4月24日，商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示，其大模型日日新5.0发布会受到市场极大关注，公司将进一步刊发相关公告。商汤的生成式AI业务在2023年取得了显著增长，占总收入的35%。

商汤
中山大学“梗王”大模型CLoT 靠讲笑话入选顶会CVPR

中山大学HCP实验室联合SeaAILab和哈佛大学等单位开展的一项研究，成功地让大型人工智能模型通过讲笑话的方式，探索多模态大模型的创造力，并因此获得了计算机视觉和模式识别领域的顶级会议CVPR的认可。这项研究的关键在于使用来自日本的“大喜利”创新响应游戏作为数据源。此次研究的成功，不仅展示了该实验室在AI领域的创新能力，也为未来的人工智能研究提供了新的

大模型梗王 AI头条
荐Perplexity要搞竞价排名了，大模型的尽头……就还是广告？

还记得曾经从英伟达和贝索斯们手里融了7360万美元，誓要以AI驱动的透明搜索体验挑战谷歌，俘获大批社区支持者的Perplexity吗？这家一直鄙视广告业务的硅谷明星AI公司，也准备开始卖广告了。看起来Perplexity已经想明白了，在探索成为一个更好的Perplexity2.0之前，它首先选择活下去。

人工智能搜索引擎广告业务
华为开发者大会定档将发布盘古大模型5.0

华为开发者大会定于6月21日至23日在东莞松山湖盛大举行，届时将见证盘古大模型5.0与HarmonyOSNEXT鸿蒙星河版的首次同台展示。盘古大模型系列，作为华为精心打造的一系列预训练大模型，涵盖了自然语言处理、计算机视觉以及科学计算等多个领域。华为期望在Mate70销售时，能够携带“纯血”鸿蒙系统上市，这不仅是华为的目标，更是其努力的方向。

华为开发者大会盘古大模型

今日大家都在搜的词：

热文

3 天
7天

微软开发新型大模型压缩方法SliceGPT

今日大家都在搜的词：

热文

站长商机