首页 > 业界 > 关键词  > SliceGPT最新资讯  > 正文

微软开发新型大模型压缩方法SliceGPT

2024-01-29 16:57 · 稿源:站长之家

站长之家(ChinaZ.com)1月29日 消息:SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。

这意味着使用SLICE GPT的模型可以在更少的GPU上运行,并且运行速度更快,无需任何额外的代码优化。在24GB的消费级GPU上,将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

image.png

论文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题,并提供了一种有效减轻这些资源需求的方法,同时保持或仅轻微牺牲模型性能,这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说,SLICE GPT能够减少大型语言模型的尺寸,通过在不损失显著性能的前提下,减少模型参数数量,SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率,减少了所需的计算资源,并且能够在去除一定比例的模型参数的同时,保持模型的性能。此外,SLICE GPT不仅适用于特定的模型或架构,它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案,通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵,通过将模型中的每个权重矩阵替换为一个更小的(密集的)矩阵来减少网络的嵌入维度,有效地缩减了模型的大小。

其次是维持计算不变性,SLICE GPT引入了变换器网络中的“计算不变性”概念,通过特定的变换操作,改变权重矩阵的形状,而不改变其在模型中的功能和影响,从而达到减少模型参数的目的,同时保持模型的性能。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。

举报

  • 相关推荐
  • 华为nova 14活力版、nova Flip S官宣明天发布

    华为终端官方宣布,将于10月17日14:30举行nova系列新品玩机秀活动,届时华为nova 14活力版与华为nova Flip S将同步登场。nova Flip S已在中国电信终端产品库亮相,提供六款时尚配色,存储版本包括12GB+256GB、12GB+512GB和12GB+1TB,出厂预装鸿蒙OS5系统,预计售价5000元价位段。外观延续经典1:1方形外屏设计,镜头模组与屏幕巧妙融合,展现独特科技美感。

  • 1299元 华为FreeClip 2耳夹耳机预售卖爆:1小时总量突破80000台

    华为FreeClip 2耳夹耳机10月14日开启预售,20日正式开售,售价1299元。预售1小时销量突破8万台。提供丹宁蓝、摩登黑、羽纱白三色,采用玲珑方盒设计。耳机采用亲肤液态材质,柔软度提升25%,单耳仅重5.1克,支持IP57防尘防水。搭载自研超澎湃双引擎单元,响度和低音动力均提升100%,并配备第三代音频芯片及NPU AI处理器,算力提升10倍。支持实时动态降噪、三麦克风通话降噪、高清空间音频及鸿蒙AI助手。单耳续航9小时,整机达38小时。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • 重新定义开放式耳机通讯体验:开石OpenRock推出全球首款可拆卸磁吸咪杆开放式耳机,于Kickstarter震撼上线

    OpenRock推出全球首款可拆卸磁吸开放式耳机Link20,搭载独家MagShield™ FusionTech磁吸连接技术,解决传统开放式耳机通话质量差的痛点。产品采用人体工学近场音孔设计,配合5麦克风阵列与AI降噪系统,实现高清通话与Hi-Fi级音质。单耳仅重9克,支持IPX7防水与13小时续航,现已在Kickstarter开启首发预售,早鸟价105美元。

  • 开会必须面对面?TCL会议电视说NO!

    在分秒必争的商业环境中,传统面对面会议因效率低、成本高、协同难等问题阻碍发展。TCL会议电视通过创新技术打破局限:支持秒级无线投屏,简化设备连接;内置主流会议软件,实现一键入会;专业拾音与AI降噪确保远程沟通清晰;防眩光技术和广视角设计保障观看体验;灵活移动适配多样办公场景。其价值不仅提升会议效率,更助力企业降低差旅成本、加快决策、增强协同,在数字化浪潮中以高效抢占发展先机。

  • 第一!世纪华通旗下Century Games登顶全球Top50手游商

    知名游戏媒体PocketGamer发布《2025年全球TOP50移动游戏商》榜单,世纪华通旗下Century Games从去年第7位跃居榜首,创下该榜单晋升速度新纪录。其成功源于持续创新与精准市场洞察:既实现《Whiteout Survival》等长线产品稳定运营,又凭借《Kingshot》等新作打造跨品类爆款,形成“双强驱动”格局。公司通过“微创新”策略结合AI技术提升研发效率,构建覆盖SLG、休闲、卡牌三大核心品类的产品矩阵。2025年上半年母公司世纪华通营收172亿元,同比增长85.5%,印证了其全球化布局与长效发展潜力。

  • 想释放多网卡带宽?银河麒麟V11的MPTCP方案来了

    本文介绍银河麒麟操作系统V11的MPTCP解决方案,通过多路径TCP协议聚合多网卡带宽,实现数据传输速度倍增和链路故障无缝切换。方案提供内核级原生支持,部署简单,兼容主流应用,显著提升网络性能与可靠性,有效解决单网卡带宽瓶颈和多网卡资源闲置问题,为高吞吐业务场景打造高效网络传输新引擎。

  • ChatGPT正秘密测试私信功能:支持用户之间直接交流

    OpenAI正在为其明星产品ChatGPT测试名为私信”(Direct Messages)的社交功能。 这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具,逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

  • IBM与Anthropic达成战略合作,为企业软件开发注入AI赋能的安全和治理

    IBM与Anthropic达成战略合作,将Claude大语言模型集成至IBM软件产品及开发工具中,旨在加速企业级AI开发进程。该合作聚焦提升开发效率,在IBM全新AI集成开发环境中率先应用,支持代码生成、测试部署等全生命周期任务。内部测试显示生产力提升45%,同时确保代码质量与安全合规。双方强调将为企业提供安全可靠的AI解决方案,推动行业标准化发展。

  • ​​会议卡顿拖后腿?TCL会议平板让协作“零延迟”​​

    TCL会议平板V66N通过视听升级、智慧白板和无线投屏三大功能解决远程办公痛点:搭载5000万像素摄像头与AI影像算法,实现逆光清晰画质和发言人自动追踪;8阵列麦克风配合AI降噪,有效过滤环境杂音;超低延迟电子白板支持多人实时书写,手势擦除等智能功能简化操作;采用5G点对点传输与Wi-Fi 6协议,实现4K秒级无线投屏。内置主流会议软件,适配全场景协作,重新定义高效协作标准。

今日大家都在搜的词:

热文

  • 3 天
  • 7天