手把手教你剪「羊驼」，陈丹琦团队提出LLM-Shearing大模型剪枝法

2023-10-12 17:52 · 稿源：机器之心公众号

给 Llama2（羊驼）大模型剪一剪驼毛，会有怎样的效果呢?今天普林斯顿大学陈丹琦团队提出了一种名为 LLM-Shearing 的大模型剪枝法，可以用很小的计算量和成本实现优于同等规模模型的性能。自大型语言模型（LLM）出现以来，它们便在各种自然语言任务上取得了显著的效果。不过，大型

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

LLM-Shearing大模型剪枝法：用5%的成本拿下SOTA，比从头开始预训练更划算

陈丹琦团队近期发布了一项重要的研究成果，他们开发了一种名为LLM-Shearing的大模型剪枝法。这项技术允许将庞大的预训练模型剪枝至仅需3%的计算量和5%的成本，同时保持着SOTA水平的性能。这有望在大规模深度学习模型的研究和应用中产生广泛的影响。

大模型
LLM评估测试框架DeepEval 可离线评估大模型性能

DeepEval是一个用于对语言模型应用进行评估和单元测试的框架。它提供了各种指标，可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。如果你在开发聊天机器人、语言模型应用，DeepEval绝对是一个提高工程效率的好帮手。

DeepEval
LLM Guard：增强LLM安全性的开源工具包安全使用各种等模型

LLMGuard是一个旨在增强大型语言模型安全性的开源工具包，旨在简化LLMs在企业中的安全采用。它的设计目的是为了轻松集成和部署在生产环境中，为LLMs的输入和输出提供广泛的评估，包括清理、检测有害语言和数据泄漏，以及防止注入和越狱攻击。这一工具包的推出将有望促进大型语言模型在企业中的更广泛应用，为企业提供了更好的安全保障和可控性，从更加自信地采用这一新兴技术。

LLMGuard ChatGPT
荐CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

大语言模型黑盒，居然被CMU等机构的学者打破了?他们发现，LLM内部有可解释的表征，如果撒谎能被测谎仪检测出来!最近，来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型，并不仅仅是黑匣子，或者难以理解的庞大矩阵。在它们内部，具有可解释的内部表征。CMU等机构研究者的探索也告诉我们，人类对于AI系统的理解和控制会越

大语言模型 Llama
荐在百度，“手把手”教600万创作者内容变现

“在百度如何实现高效的商业变现?““如何开通百享计划?”“粉丝多收入少怎么办?”百家号“宝藏变现指南”直播间里，不断有人抛出问题，百家号变现业务负责人们一边讲解着赚钱干货，一边实时解答评论区创作者的疑问。这是百度百家号与新榜共同发起的“宝藏变现指南”直播周活动，针对正是百家号的创作者们。平台助力创作者，创作者以内容反哺平台，百度正与创作者同舟共济，共建正循环的内容生态，对于内容平台来说，这才是真正的长期主义。

百家号
开源机器学习库vLLM 提升大语言模型推理速度

大语言模型在改变人们的生活和职业方面影响越来越大，因为它们实现了编程助手和通用聊天机器人等新应用。这些应用的运行需要大量硬件加速器如GPU，操作成本非常高。更大的模型、更复杂的解码算法和更长的序列会导致更明显的改进。

vLLM
荐EasyPhoto：开源本地化部署的「妙鸭相机」，真的要革了「海马体」们的命了？｜手把手教你搭建「妙鸭相机」

EasyPhoto作为妙鸭相机平替，有着不输妙鸭相机的生成质量有更好的定制化空间和本地部署的优势。年初由ChatGPT引发的AI浪潮奔涌至今，除了OpenAI推出的当红炸子鸡之外，中文互联网内热度最高的产品，非前段时间霸屏的「妙鸭相机」莫属了。第二次生成将使用更高的分辨率。

妙鸭相机海马体 EasyPhoto
Evisort成功开发法律合同领域的大型语言模型(LLM)

Evisort成功开发了专门用于法律协议的大型语言模型，并将其作为其新的多方位生成AI引擎的关键组成部分。该LLM将使Evisort能够提供比通用的第三方LLMs更准确和响应更灵活的AI创新，从帮助组织更好地管理合同。这一创新也受到了业界的认可，得到了微软风投M12的高度评价。

Evisort 大模型
OpenAI科学家最新大语言模型演讲火了，洞见LLM成功的关键

OpenAI研究科学家HyungWonChung在首尔国立大学做了题为「LargeLanguageModels」的演讲。他在自己的YouTube频道上写到:「这是一次雄心勃勃的尝试，旨在总结我们这个爆炸性的领域。至于哪个AI模型将成为这个新范式的旗舰代表，就让我们拭目以待吧。

OpenAI LLM
荐AI的大模型时代 ≠ 只有大模型的AI时代

什么样的技术能经历时间洗礼还历久弥新?答案或许可以归总为一个“三部曲”般的规律——兴起、发展和大规模应用，外加这个过程再一次演进式的迭代。引领第一次工业革命的是蒸汽机，当它演进成为内燃机并开始普及时，第二次工业革命的颠覆者——电能本身以及与它相关的各种设备正处于初创期在电力设备走向微电子的迭代革新时，各种燃油引擎还在持续改良和普及中�

大模型

今日大家都在搜的词：

热文

3 天
7天

手把手教你剪「羊驼」，陈丹琦团队提出LLM-Shearing大模型剪枝法

LLM-Shearing大模型剪枝法：用5%的成本拿下SOTA，比从头开始预训练更划算

LLM评估测试框架DeepEval 可离线评估大模型性能

LLM Guard：增强LLM安全性的开源工具包安全使用各种等模型

荐CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

荐在百度，“手把手”教600万创作者内容变现

开源机器学习库vLLM 提升大语言模型推理速度

荐EasyPhoto：开源本地化部署的「妙鸭相机」，真的要革了「海马体」们的命了？｜手把手教你搭建「妙鸭相机」

Evisort成功开发法律合同领域的大型语言模型(LLM)

OpenAI科学家最新大语言模型演讲火了，洞见LLM成功的关键

荐AI的大模型时代 ≠ 只有大模型的AI时代

今日大家都在搜的词：

热文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

雷军：小米17 Pro Max很多门店已经缺货

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军晒第100次健身打卡提前3个月完成健身目标

京东双11购物节官宣：10月9日晚8点开启

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

小米澎湃OS 3穿戴设备适配升级计划公布：10月开启推送

卢伟冰称小米17首销结果很不错并回应小米17为何最初无1TB

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

理想i6正式上市：首销直减1万限时售价23.98万元

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

小米17系列开售5分钟破25年国产手机首销纪录

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

雷军称没什么好犹豫的：50岁正是闯的年纪

小米非常非常缺人上热搜雷军谈小米成功秘诀

李想感谢雷军夸理想： “67Y”一起加电

站长商机