首页 > 业界 > 关键词  > LLMLingua-2最新资讯  > 正文

微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本

2024-03-25 10:59 · 稿源:站长之家

划重点:

🔍 微软研究发布了 LLMLingua-2,一种用于任务不可知压缩提示的模型,可以将原始长度减少高达20%,从而降低成本和延迟。

📊 LLMLingua-2通过智能压缩长提示,去除不必要的词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%。

🚀 LLMLingua-2在多个数据集上进行了评估,显示出与强基线相比的显著性能改进,并在不同 LLM 之间展现了稳健的泛化能力。

站长之家(ChinaZ.com)3月25日 消息:微软研究发布了名为 LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从而降低成本和延迟。研究团队写道:“自然语言存在冗余,信息量不尽相同。”

LLMLingua-2比其前身 LLMLingua 和类似方法快3到6倍。LLMLingua-2使用了 MeetingBank 中的示例进行训练,该数据集包含会议记录及其摘要。要对文本进行压缩,首先将原始文本输入训练好的模型。模型对每个词语进行评分,根据周围语境为其分配保留或移除的点数。然后选择具有最高保留值的词语,以创建缩短的提示。

微软研究团队在多个数据集上对 LLMLingua-2进行了评估,包括 MeetingBank、LongBench、ZeroScrolls、GSM8K 和 BBH。尽管模型规模较小,但在各种语言任务(如问答、摘要和逻辑推理)中,它始终优于原始的 LLMLingua 和选择性上下文策略。同样,相同的压缩策略对不同 LLM(从 GPT-3.5到 Mistral-7B)和语言(从英语到中文)都有效。

image.png

LLMLingua-2只需两行代码就可以实现。该模型还已集成到广泛使用的 RAG 框架 LangChain 和 LlamaIndex 中。微软提供了演示、实际应用示例以及说明提示压缩的好处和成本节省的脚本。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。

论文地址:https://arxiv.org/abs/2403.12968

项目入口:https://top.aibase.com/tool/llmlingua-2

举报

  • 相关推荐
  • Neuralink突破全球12例植入!微美全息(WIMI.US)构建脑机生态步入新阶段!

    马斯克旗下Neuralink宣布全球已有12人植入脑机接口设备,累计使用超2000天。该公司自2024年获FDA批准后开展人体试验,计划未来六年运营五家诊所并推出三类植入设备。脑机接口技术不仅用于治疗神经疾病,还探索人机融合增强人类能力。全球市场规模预计2025年达19.5亿美元,医疗康复和消费级应用成为主要增长点。该技术正从科幻走向现实,推动精准医疗和智能交互发展。

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 小鹅通亮相腾讯全球数字生态大会,eLink入选《腾讯云出海解决方案白皮书》

    2025年9月16日,腾讯全球数字生态大会在深圳举行,聚焦智能化与国际化两大产业方向。大会发布《腾讯云出海解决方案白皮书》,一站式电商平台eLink入选标杆案例,为海外创作者提供全球化运营支持。eLink通过深度本土化改造,打通需求落地到高效运营全链路,助力创业者降低出海门槛,推动产业智能化与全球化协同发展。

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • APOLLO年中展望:在滞胀的十字路口——下一步是什么?

    美国关税政策调整引发经济波动。特朗普政府推行的新关税制度使平均关税率升至15.8%,为近90年来最高水平,加剧市场不确定性。经济学家预测经济增长放缓、通胀上升,利率将长期维持高位。企业投资计划波动加剧,消费者信心下滑,预计2025年美国GDP增长仅1.2%。尽管衰退概率上升至25%,但专家认为短期内不会出现全面衰退,供需双方均面临阻力。全球经济增长预期下调至2.6%,低于此前3%的预期。

  • 人单合一20年:构建AI时代的智能交互生态

    第九届人单合一模式引领论坛暨第二届零距离卓越奖颁奖典礼在北京举行,聚焦“组织智能:构建AI时代的智能交互生态”。论坛汇聚全球400多位专家学者及企业代表,探讨AI时代组织智能的未来。海尔集团董事局主席张瑞敏提出人单合一模式历经20年演进,已从1.0迭代至2.0阶段,实现从零距离到零边界的升级。该模式以人的价值最大化为核心,通过机制创新激发个体创造力,被全球管理学界广泛认可并纳入ISO国际标准。论坛还成立了“零距离卓越联盟”,推动跨行业经验共享与协同创新。

  • 2025工博会:研祥“AI+工业”已就位!

    第25届中国国际工业博览会即将开幕,研祥集团携旗下研祥智能、研祥金码、亿万科三大品牌亮相。9月23-27日,6.1馆D005展位将展出50余款AI+工业产品,展示未来工业生态。2025工博会,研祥即将抵达现场,与您不见不散!

  • 技嘉2025发布会:“从心出发 我们的主张”,迈向AI新纪元

    技嘉今日举办“从心出发,我们的主张”主题产品发布会,聚焦PC硬件领域,围绕用户需求发布全新主板、整机及软件工具。发布会展示了技嘉在极限性能、美学设计、AI算力及装机体验等方面的技术实力,推出多款支持AMD和Intel平台的主板产品,并重点演示了液氮超频、D5黑科技2.0内存优化及AI算力全家桶等创新技术。通过软硬件协同与用户体验优化,技嘉传递了“始于需求,�

今日大家都在搜的词: