首页 > 业界 > 关键词  > LLMLingua-2最新资讯  > 正文

微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本

2024-03-25 10:59 · 稿源:站长之家

划重点:

🔍 微软研究发布了 LLMLingua-2,一种用于任务不可知压缩提示的模型,可以将原始长度减少高达20%,从而降低成本和延迟。

📊 LLMLingua-2通过智能压缩长提示,去除不必要的词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%。

🚀 LLMLingua-2在多个数据集上进行了评估,显示出与强基线相比的显著性能改进,并在不同 LLM 之间展现了稳健的泛化能力。

站长之家(ChinaZ.com)3月25日 消息:微软研究发布了名为 LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从而降低成本和延迟。研究团队写道:“自然语言存在冗余,信息量不尽相同。”

LLMLingua-2比其前身 LLMLingua 和类似方法快3到6倍。LLMLingua-2使用了 MeetingBank 中的示例进行训练,该数据集包含会议记录及其摘要。要对文本进行压缩,首先将原始文本输入训练好的模型。模型对每个词语进行评分,根据周围语境为其分配保留或移除的点数。然后选择具有最高保留值的词语,以创建缩短的提示。

微软研究团队在多个数据集上对 LLMLingua-2进行了评估,包括 MeetingBank、LongBench、ZeroScrolls、GSM8K 和 BBH。尽管模型规模较小,但在各种语言任务(如问答、摘要和逻辑推理)中,它始终优于原始的 LLMLingua 和选择性上下文策略。同样,相同的压缩策略对不同 LLM(从 GPT-3.5到 Mistral-7B)和语言(从英语到中文)都有效。

image.png

LLMLingua-2只需两行代码就可以实现。该模型还已集成到广泛使用的 RAG 框架 LangChain 和 LlamaIndex 中。微软提供了演示、实际应用示例以及说明提示压缩的好处和成本节省的脚本。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。

论文地址:https://arxiv.org/abs/2403.12968

项目入口:https://top.aibase.com/tool/llmlingua-2

举报

  • 相关推荐
  • FaceTime成诈骗新工具,认准微粒贷客服号码

    近期出现多起冒充贷款客服的FaceTime诈骗案件,诈骗分子伪装成金融机构客服,以"微粒贷利率过高需注销账户"等理由诱导受害者转账。典型案例中,L先生接到自称微粒贷客服的FaceTime来电,对方以"保护资金安全"为由要求将存款转入指定账户,转账后发现被骗。警方提醒:1.警惕陌生FaceTime来电,不透露个人信息;2.凡提及"调整利率""屏幕共享""转账汇款"等均为诈骗;3.遇可疑情况立即拨打官方客服95384核实;4.若已转账要立即报警并冻结账户。建议通过正规银行渠道办理贷款业务,官方客服不会通过FaceTime联系客户。

  • 巴黎世家半身裙被吐槽像平角短裤 售价高达4500元

    ​近日,奢侈品牌巴黎世家推出的一款女款半身裙在时尚圈和消费者群体中引发了广泛热议。不少网友在看到该裙子后纷纷吐槽,称其造型与平角短裤极为相似,直呼“看不懂时尚”。 据巴黎世家官网介绍,这款女士深蓝色弹力平纹针织半身裙亮相于2025秋季系列Look50和Look54。裙子采用弹力棉混纺平纹针织面料,设计为平角短裤造型的迷你半身裙,剪裁裆部,中腰设计,弹性�

  • 2025 MWC 上海,IndoorLink无线讲解器在现场!

    6月18日,亚洲科技盛会MWC上海开幕。中国智能导览品牌IndoorLink携旗舰无线讲解器亮相,凭借500米超距抗干扰传输、智能多团队协作系统及全场景适配能力成为展会焦点。其搭载RangeBoost技术实现500米无障碍稳定传输,信号穿透力达普通设备2.6倍。创新智能信道管理系统支持999+无限频道和300+设备同步运行,毫秒级跳频规避干扰,确保多语种分组导览"零串频"。产品通过国际认证,已服务全球30国,在巴塞罗那MWC经5000人次极限考验。同时推出主副双讲+同声传译系统,支持12种语言实时翻译,助力跨国企业打破文化壁垒。安全方面通过本安防爆认证,成为业内首款可进入石化车间的讲解设备。这款承载30多项专利的中国声学方案,正重塑知识传播边界。

  • 如何用 AI工具 生成论文选题

    本教程介绍如何利用DeepSeek AI工具生成学术论文选题。首先需要明确自身专业、研究方向、兴趣领域等研究信息。通过特定格式构建提问指令,在DeepSeek平台输入后,AI会基于算法分析生成10个相关选题。用户需从研究价值、创新性、可行性等维度评估选题,筛选出最适合的研究方向。该工具能有效帮助研究者快速获取选题思路,提高学术论文创作效率。

  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • Neuralink实现渐冻患者语言功能重建,微美全息(WIMI.US)完善AI+脑机接口生态圈

    埃隆·马斯克旗下Neuralink公司利用脑机接口技术,帮助一名渐冻症患者通过植入设备重新"说话"。该技术结合xAI的人工智能,将患者脑信号转化为语音。目前全球已有3位患者接受植入,其中两位恢复部分生活能力。脑机接口技术分为侵入式、非侵入式和半侵入式三种,在医疗、教育、游戏等领域应用前景广阔。我国"十四五"规划已将其列为重点科技项目。微美全息等企业正推动"脑机接口+"生态建设,整合AI、量子计算等技术拓展应用场景。该技术虽处临床试验阶段,但已展现帮助失语、瘫痪患者康复的潜力。未来随着AI与神经科学结合,人机协同将带来更多可能性。

  • 上海飞络|AI Agent驱动企业MSS安全运营变革 ---构建高效低成本防护体系

    在数字化转型浪潮中,企业面临指数级增长的网络威胁。上海飞络信息科技的Synergy AI产品通过AI+Agent技术重塑安全防护格局:1)统一告警分析:整合多元设备告警,精准识别APT攻击等高级威胁;2)智能设备调度:自动协调防火墙、WAF等设备应对DDoS攻击;3)实时威胁阻断:秒级隔离受感染终端,防止数据泄露。该方案使金融企业平均响应时间大幅缩短,显著降低数据泄露风险。未来将持续优化预测能力,实现主动防御,为企业构建高效智能的托管安全服务体系。

  • 想偷窥没门!华为Pura 80亮屏即防窥:AI一眼识破旁人目光

    在今天的华为Pura 80新品发布会上,华为常务董事、终端BG董事长余承东介绍了关于新机的一些信息。 据介绍,华为Pura 80系列全系搭载AI防窥保护,在亮屏解锁状态下,手机会提示旁人注视风险,当他人看向机主的屏幕时,自动提醒用户留意屏幕隐私,避免敏感信息泄露。 而在浏览图库中的隐藏相册时,当识别到旁人注视风险,则会自动对全局内容进行隐藏保护。 同时还有AI

  • 尊界S800上市三天大定达2600台 售价70.8万元起

    ​近日,汽车市场传来一则重磅消息,尊界汽车旗下首款车型尊界S800上市72小时,大定数量便突破2600台,在国产豪华汽车领域引发广泛关注。 尊界S800此次共推出6个版本,售价区间设定在70.8万元至101.8万元,这一价格使其成为鸿蒙智行迄今为止发布的最贵车型,也被视为国产豪华汽车的新标杆。 自上市以来,尊界S800的大定数量呈现出迅猛增长的态势。上市仅1小时,大定数�

  • 高通骁龙8 Elite 2主频再创新高:小米16性能稳了

    博主数码闲聊站爆料,高通骁龙8 Elite 2的CPU频率突破5GHz,刷新了行业纪录。 他还爆料,5GHz是验证架构的峰值频率,最终的频率会结合能效表现进行调整,所以目前骁龙8 Elite 2的频率还没有彻底敲定。