微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

2024-02-11 13:18 · 稿源：站长之家

划重点:
⭐️ 可将大模型体量压缩25% 左右，性能保持不变。
⭐️ SliceGPT 利用计算不变性简化和压缩模型。
⭐️ 切片操作后的模型可以在消费级显卡上运行，无需额外代码优化。

站长之家（ChinaZ.com）2月11日消息:微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25% 左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT 成功应用于多个大型模型，如 LLAMA-270B、OPT66B 和 Phi-2。

SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换，SliceGPT 实现了对模型的极限压缩。此外，切片操作后的模型可以直接在消费级显卡上运行，如 N 卡的4090、4080，无需进行额外的代码优化，使得部署更加便捷。

在实验中，研究人员发现 SliceGPT 的切片技术非常简单高效，可以在几个小时内使用单个 GPU 完成模型压缩，无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能，同时吞吐量得到提升，整体效果令人满意。

SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径，将大幅节省部署资源同时保持模型性能不变。这一技术的推出，有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

开源地址:https://github.com/microsoft/TransformerCompression

论文地址:https://arxiv.org/abs/2401.15024

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐微软开源最强小参数大模型—Phi-3 Mini

4月23日晚，微软在官网开源了小参数的大语言模型——Phi-3-mini。Phi-3-mini是微软Phi家族的第4代，有预训练和指令微调多种模型，参数只有38亿训练数据却高达3.3Ttokens，比很多数百亿参数的模型训练数据都要多，这也是其性能超强的主要原因之一。Phi-3-medium的性能可媲美Mixtral8x7B和GPT-3.5，资源消耗却更少。

微软
荐苹果开源OpenELM，大模型开源领域再迎一巨头！

4月24日，苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似，是一款专门针对手机等移动设备的模型。这次苹果真的是很有诚意的开源，一开到底所有内容都贡献出来了，家大业大就是敢玩。

OpenELM 开源
荐发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试

【新智元导读】前段时间，微软公布并开源了最新一代大模型WizardLM-2，号称性能堪比GPT-4。还未上线一天，模型权重和公告全被删除了，原因竟是......上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待，微软团队承诺，会在测试完成后重新上线。

GPT-4 WizardLM-2
DBRX抢占开源大模型王座编程、数学等领域超越GPT-3.5

最新开源大语言模型DBRX以其惊人的1320亿参数量成为业界新宠。该模型不仅在语言理解、编程和数学等方面超越了业内领先的开源模型在效率上有所突破。随着其在各项基准测试中的优异表现，DBRX有望成为未来开源大模型发展的重要里程碑，为人工智能领域的进步贡献力量。

DBRX AI头条
阿里刚开源32B大模型，我们立马测试了“弱智吧”

阿里的通义千问，终于拼齐了1.5系列的最后一块拼图——正式开源Qwen1.5-32B。直接来看“成绩单”。GQA的引入就降低了注意力计算的数量，从加速了推理时间。

阿里大模型 Qwen1.5
千亿开胃菜中国电信开源12B星辰大模型：性能提升30%

中国电信近期宣布开源其12B参数规模的巨型AI模型TeleChat-12B，此举标志着国内大模型技术发展的又一重要进展。与1月份发布的7B参数版本相比，TeleChat-12B在内容理解、性能表现和应用场景等方面实现了约30%的整体提升，特别是在多轮对话推理和安全相关领域的能力上，提高超过了40%。除了在传统行业中的应用，星辰大模型也在积极探索更多前沿领域的应用，例如在无人机智能编

中国电信开源 AI模型
多模态大模型Reka Core发布性能与GPT-4相媲美

RekaCore是一款最新发布的多模态大型语言模型，其性能可与GPT-4相媲美，甚至在某些方面超越了现有的前沿模型。这一技术突破为人工智能领域带来了新的里程碑，特别是在图像、视频和音频的上下文理解能力方面。随着Core的进一步优化和应用，我们有理由相信，它将在多个领域产生深远的影响，推动人工智能技术的进步和社会的发展。

多模态大模型 AI头条
孟子3-13B大模型正式开源

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。这一举措无疑将推动大模型技术的发展和应用，为AI产业的进步贡献力量。

大模型 AI头条
荐开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

扎克伯格:「有了Llama3，全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕，Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。

GPT-4 Llama3 AI
月之暗面：Kimi 大模型API 已支持 Tool Calling 功能

月之暗面宣布Kimi大模型学会了使用工具，即API已支持ToolCalling功能。通过这个功能，开发者可以让Kimi大模型与各种自定义外部工具进行交互，从拓展AI应用的想象空间。月之暗面表示，随着外部工具调用能力的提升，基于大模型的AIAgents应用将进入新阶段，为用户带来更多可能性，从聊天对话到完成各种任务，融入用户实际工作流程。

今日大家都在搜的词：

热文

3 天
7天

微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

今日大家都在搜的词：

热文

站长商机