首页 > 业界 > 关键词  > SliceGPT最新资讯  > 正文

微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变

2024-02-11 13:18 · 稿源:站长之家

划重点:

⭐️ 可将大模型体量压缩25% 左右,性能保持不变。

⭐️ SliceGPT 利用计算不变性简化和压缩模型。

⭐️ 切片操作后的模型可以在消费级显卡上运行,无需额外代码优化。

站长之家(ChinaZ.com)2月11日 消息:微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25% 左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT 成功应用于多个大型模型,如 LLAMA-270B、OPT66B 和 Phi-2。

image.png

SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换,SliceGPT 实现了对模型的极限压缩。此外,切片操作后的模型可以直接在消费级显卡上运行,如 N 卡的4090、4080,无需进行额外的代码优化,使得部署更加便捷。

在实验中,研究人员发现 SliceGPT 的切片技术非常简单高效,可以在几个小时内使用单个 GPU 完成模型压缩,无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能,同时吞吐量得到提升,整体效果令人满意。

SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径,将大幅节省部署资源同时保持模型性能不变。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

开源地址:https://github.com/microsoft/TransformerCompression

论文地址:https://arxiv.org/abs/2401.15024

举报

  • 相关推荐
  • 实测OpenClaw中文版Molili自定义大模型:这才是真·AI智能体

    本文介绍了OpenClaw中文版Molili,一款能真正执行任务的桌面AI智能体。它解决了传统AI“只会说不会做”的痛点,通过微信等平台直接下达指令,即可自动操作电脑完成查找文件、发送文档等任务。核心亮点包括:支持自定义接入各类大模型,打破模型绑定;提供8000+现成技能,覆盖办公、编程、生活等场景;注重安全与隐私,设有操作权限管控和本地数据处理机制;对中文指令和国产生态有深度优化。

  • OpenClaw中文版Molili开放自定义大模型接入 国产AI智能体再突破

    3月5日,OpenClaw中文版Molili正式上线自定义接入大模型功能。该产品以极致自由度、全链路本土化适配与零门槛操作为特点,为个人及企业用户提供全新AI自动化解决方案,推动桌面AI智能体从“对话交互”向“落地执行”深度转型。核心亮点包括自定义大模型接入、全场景使用自由,支持企业无缝接入私有模型,个人用户可自主选择偏好模型,打破传统AI工具模型绑定限制。产品突破“重对话、轻执行”行业痛点,实现真实电脑端操作,覆盖文件处理、信息搜索等重复性任务,支持微信、钉钉等多平台远程指挥,并搭载8000+技能矩阵,全方位保障用户隐私与数据安全。

  • 周鸿祎解读AI短剧:直言有望颠覆Netflix 生产效率提升数十倍

    今日,360集团创始人周鸿祎发布视频,围绕AI短剧行业发展发表观点。周鸿祎指出,借助AI技术,短剧的制作成本有望降低百倍,生产效率可提升数十倍,短剧还可能会颠覆掉Netflix,Netflix现在正在颠覆掉好莱坞。 周鸿祎表示,短剧在短视频时代应运而生,且中国短剧已成为文化输出载体,受到全球观众关注,但此前短剧发展受高拍摄成本制约,布景、演员等环节的资源限制,

  • 一篇帮你看懂!生物医药LIMS采购决策指南

    在生物医药研发数字化转型中,LIMS采购是关键环节,其选型结果直接影响系统落地效果与运营价值。文章指出,选型应聚焦合规、研发适配、本土服务、长期保障四大核心维度,科学选择真正适配企业发展的LIMS解决方案。具体要点包括:优先选择合规内生于系统设计的厂商,确保满足FDA/NMPA严苛要求;选择深刻理解生物医药研发流程的专业厂商,避免通用系统与研发流程脱节;重视本土化适配与服务能力,规避国际品牌本土化不足的短板;评估厂商的持续服务与技术迭代能力,保障系统长期生命力。选型需遵循定需求、查案例、评实力、测系统四步骤,确保系统贴合研发流程。

  • 售价709元!特斯拉推出迷你储能站造型充电宝:1:40比例复刻Megapack

    特斯拉官网最新上架了一款充电宝周边产品1:40比例Megapack充电器,定价709元。 这款充电宝依托特斯拉Megapack真品3D CAD数据打造,按1:40比例精准复刻,在外观上高度还原原型细节。 不仅复刻了棱角分明的矩形轮廓与哑光金属质感涂层,还设计了可开启的操作间门,内部复刻电池组与线缆结构,顶部还还原了散热风扇造型。 右上角嵌入特斯拉LOGO,底部配有一圈灯带,激活充电�

  • AI日报:OpenAI上线 GPT-5.3 Instant;通义千问负责人林俊旸宣布离职;谷歌发布 Gemini 3.1 Flash-Lite

    本期AI日报聚焦行业动态:OpenAI紧急上线GPT-5.3 Instant,重点解决“爹味说教”问题;Anthropic推出Claude Code语音编程模式,提升开发效率。马云带领阿里与蚂蚁核心层访问云谷学校,探讨AI浪潮下的教育变革。AReaL v1.0框架发布,降低智能体强化学习开发门槛。阶跃星辰开源Step3.5Flash模型,参数达1960亿。阿里通义千问负责人林俊旸离职,反映大模型人才高频流动趋势。谷歌发布Gemini

  • DeepSeek V4 Lite悄然更新:2000亿小参数性能逼近美国顶流

    虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。 DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。 然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区�

  • Joyoai以“快乐AI,一站式服务”,布局聚合AI平台

    Joyoai以“快乐AI,一站式服务”为核心定位,正式布局聚合AI平台,深度联动自有智能硬件,打造“AI+硬件”家庭服务新生态。该平台旨在解决行业多模型切换不便、软硬件脱节等痛点,通过一个APP集成多款主流大语言模型并支持一键切换,同时深度联动自有智能音响、玩具等硬件产品,覆盖亲子学习、银发健康等多元家庭场景,构建“APP+硬件”完整服务闭环。平台支持离线对话与在线低延迟响应,并配备完善的会员体系与运营后台,预计2026年7-9月完成研发并上架主流应用商店。此举彰显了Joyoai在家庭AI服务领域的布局决心。

  • MOZA魔爪模拟器率先布局AI赛道,发布全球首个支持硬件反馈的AI驾驶教练

    在GDC2026上,MOZA魔爪发布了旗舰级运动平台伺伏电缸HMA150,并推出两大自研AI技术:AI Coach(Racing Lab)与AI Motion。HMA150以4轴3自由度设计,具备150mm长行程、300mm/s运动速度及超1G峰值加速度,支持150Hz高频振动反馈,实现超低延迟与高精度力反馈。AI Coach是全球首个支持硬件反馈的AI驾驶教练,通过强化学习训练,为不同赛道与车辆组合提供极限驾驶策略与实时数据对比,帮助车手提升水平。AI Motion则通过AI实时解析游戏画面与音频,将3A游戏中的视觉与音频元素转化为运动与触觉反馈,扩展了运动平台在《GTA》《荒野大镖客》等主流游戏中的应用场景。此次发布标志着MOZA在硬件性能与AI生态整合上的全面升级。

  • AI 输入法,还会有什么新故事?

    所有生意都可以通过AI再做一遍。这一次,故事从最熟悉的输入键盘开始。 当我们敲击键盘、点击语音,那个容易被忽视的输入法正在悄然间发生变化——输入法能听懂更多方言、能把口语化表述自动换行整理成书面语,甚至还能自己帮自己写文案、续写……输入法变得越来越「聪明」的背后,是各家厂商正将最新的大模型技术,悄悄放进这个每天使用几十上百次的工具里。

今日大家都在搜的词: