首页 > 业界 > 关键词  > LoRAShear最新资讯  > 正文

微软研究员推LoRAShear技术:高效对大语言模型结构化剪枝

2023-11-07 10:29 · 稿源:站长之家

划重点:

- 🚀 LoRAShear:一种高效的LLMs结构化剪枝与知识恢复方法。

- 🧠 LLMs:快速处理文本数据,助力搜索引擎和问答系统。

- 💡 知识更新:微软研究人员提出结构剪枝方法,提高知识保存率。

站长之家(ChinaZ.com)11月7日 消息:微软的研究人员近日推出了一项名为LoRAShear的创新技术,旨在剪枝大型语言模型(LLMs)并实现知识的高效恢复。LLMs在处理文本数据和迅速检索相关信息方面表现出色,广泛应用于搜索引擎和问答系统。这项技术的问世将有望帮助用户更轻松地找到所需信息,极大地促进了人工智能的发展。

在LLMs的日常维护工作中,知识的更新和恢复是至关重要的任务之一。目前,一种常见的知识更新方法是通过精细调整(fine-tuning)。开发人员可以取得一个预训练的模型,然后在特定数据集上进行精细调整,从而更新其知识。这使得模型能够了解最新事件或特定领域的信息,为研究人员和专业人士提供了有力的工具。

image.png

微软的研究人员在这一领域取得了新的突破,他们开发了LoRAShear技术,这是一种高效的LLMs剪枝与知识恢复方法。所谓的“剪枝”是指通过移除或减少神经网络架构中的某些组件或元素,从而使其更加高效、紧凑和计算要求更低。

LoRAShear采用了Lora Half-Space Projected Gradient(LHSPG)方法,实现了渐进式结构剪枝,实现知识的高效传递,同时引入了动态知识恢复阶段,使其在预训练和指导性微调的方式下执行多阶段的精细调整。

研究人员表示,LoRAShear技术可以应用于通用的LLMs,通过分析LLMs与LoRA模块的依赖图,实现结构剪枝和知识恢复。他们提出了一种独特的算法,用于创建原始LLMs和LoRA模块的依赖图,还引入了一种结构稀疏优化算法,利用LoRA模块的信息来更新权重,从而提高了知识的保存率。

LoRAPrune技术将LoRA与迭代结构剪枝相结合,实现了高效的参数微调和直接硬件加速。他们表示,这种方法在内存使用效率上非常高,仅依赖于LoRA的权重和梯度来进行剪枝标准。

研究人员通过在开源LLAMAv1上实施LoRAShear技术来证明其有效性,他们发现,20%的LLAMAv1剪枝后,性能下降了1%,而50%的剪枝模型在评估基准上保持了82%的性能。

尽管LoRAShear技术在LLMs的知识恢复方面取得了显著的进展,但仍然面临着大规模计算资源的需求和缺乏预训练和指导性微调数据集的挑战。未来的工作将集中在解决这些挑战,为人工智能领域的发展提供更多的支持。

论文网址:https://arxiv.org/abs/2310.18356

举报

  • 相关推荐
  • 为什么手机迷恋上灵动岛 ColorOS陈希解释原因

    微博话题为什么手机迷恋上岛”引发热议,在苹果推出灵动岛之后,机圈纷纷上岛”。 ColorOS设计总监陈希表示,在对抗信息过载的信息海洋里,通知的优先级需要被再次分层,通过设计让重要的信息更加重要,灵动岛初心虽出自遮丑,但也具备了高实用性,是一个不错的设计实践,经过几年的发展,灵动岛的生态也越来越完善。 事实也证明大部分用户已经接纳并喜欢这个全

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • OPPO ColorOS宣布升级无网畅聊 没网也能发图片、语音

    日前,OPPO ColorOS宣布无网畅聊全新升级,在无网状态下,不仅能打语音电话,还能发送图片、文字和语音。 使用路径:打开设置”-选择移动网络”-开启无网畅聊”,选择你想联系的欧加手机-发送消息。 据了解,无网畅聊是一项利用蓝牙技术解决近场通信问题的功能。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • 华为首次官宣非凡大师品牌Logo!非凡大师家族徽标正式亮相

    今日下午,华为Mate XTs非凡大师及全场景新品发布会召开,将推出其新一代三折叠屏旗舰手机。 发布会初始,华为常务董事、终端BG董事长余承东宣布,华为推出全新的非凡大师系列徽标。 据余承东介绍,华为以极致的产品致敬这个时代的非凡大师,代表极致美学、极致工艺、极致创新”的集大成者。

  • 成都万达瑞华酒店DELI SHOP面包屋|用时间发酵的美味

    DELI+SHOP坚持手工制作面包甜点,采用优质原料现烤现售,提供铁观音冰乳酪可颂、咸黄油红豆碱水贝果等多款明星单品。同时推出能量套餐,支持在线选购。万达瑞华酒店作为万达旗下奢华品牌,位列国内高端酒店前三,秉承“以人为本”理念,覆盖设计、建设、管理全产业链,目前拥有230余家开业酒店,业务遍及全球300余城市。

  • 智界全新LOGO正式发布!尹同跃:奇瑞集团所有资源向智界倾斜

    华为今日下午举办智界及问界秋季新品发布会。 会上,奇瑞集团董事长尹同跃介绍,智界是我们毫无保留的第一战略优先级品牌。 8月初,我和余承东总在深圳正式签订了智界品牌2.0战略协议,智界汽车由华为全面主导,从此进入纯血鸿蒙时代,智界汽车在全新战略下成立新能源公司,并完全独立运营。 奇瑞集团所有资源向智界倾斜,所有的产品线品牌,都要为智界让道,�

  • 妙手ERP荣膺TikTok Shop 2025年度H1优质招商服务商,携手共创跨境新未来!

    8月27日,TikTok Shop在杭州成功举办2025东南亚跨境生态服务商大会,以“生态共融·价值共生”为主题,汇聚平台业务负责人、跨境专家及近百家优秀服务商代表,共绘东南亚跨境生态发展蓝图。妙手ERP凭借专业的跨境电商店铺运营解决方案、技术实力及优质服务,荣获“TikTok Shop 2025年度H1优质招商服务商”奖项。TikTok在东南亚拥有3.25亿月活用户,用户月均使用时长超35小时,平台采用“内容+货架”双场域模式,将直播与短视频打造为核心消费场景。2025年上半年,TikTok Shop东南亚市场总GMV突破168.64亿美元,已逼近2024全年规模,其中泰国市场以54.19亿美元领跑。妙手ERP已全面接入TikTok Shop东南亚全站点,提供全流程跨境电商SaaS解决方案,全方位赋能卖家降本增效。未来,妙手将秉持初心,持续提升产品功能与服务,护航跨境卖家高效出海。

今日大家都在搜的词: