LLMLingua2

微软研究发布了名为LLMLingua-2的模型，用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记，同时保留关键信息，使得提示长度可减少至原长度的20%，从降低成本和延迟。该公司认为这是一个有前途的方法，可以通过压缩提示实现更好的泛化能力和效率。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“LLMLingua2”的相关热搜词：

相关“LLMLingua2” 的资讯410篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
微软新工具LLMLingua-2：可将 AI 提示压缩高达80%，节省时间和成本

微软研究发布了名为LLMLingua-2的模型，用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记，同时保留关键信息，使得提示长度可减少至原长度的20%，从降低成本和延迟。该公司认为这是一个有前途的方法，可以通过压缩提示实现更好的泛化能力和效率。

LLMLingua-2 微软 AI头条
20倍的压缩比例！微软发布LLMLingua:压缩长提示并加快模型推理速度

微软的研究团队开发了一种名为LLMLingua的独特粗细压缩技术，旨在解决大型语言模型中长提示带来的问题。LLMs以其强大的泛化和推理能力显著推动了人工智能领域的发展，展示了自然语言处理、自然语言生成、计算机视觉等方面的能力。该方法表现出色，并提供了一种改善LLM应用程序的效果和可负担性的有用方式。

LLMLingua 大模型 AI头条
荐 Scaling Law触礁「数据墙」？Epoch AI发文预测LLM到2028年耗尽所有文本数据

【新智元导读】训练数据的数量和质量，对LLM性能的重要性已经是不言自明的事实。EpochAI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水，他们预测，互联网上可用的人类文本数据将在四年后，即2028年耗尽。「最大的不确定性在于，你会看到什么样的技术突破。

ScalingLaw LLM 人工智能
手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。目前在移动设备上运行的模型相对较小，并且消耗大量内存，这在很大程度上限制了其应用场景。如果PowerInfer-2.0能够与手机厂商进一步紧密合作，相信可以加速相关技术走出实验室，落地到各种真实场景。

PowerInfer-2
Yandex开源LLM训练工具节省高达20%的GPU资源

2024年6月11日，莫斯科——跨国科技公司Yandex最近推出了YaFSDP，这是一种用于训练大型语言模型的开源方法。YaFSDP是目前最有效的公开可用工具，用于增强GPU通信并减少LLM训练中的内存使用量，与FSDP相比，其训练速度提升最高可达26%，具体取决于架构和参数数量。Petals：是一个旨在简化LLM训练和微调过程的库，由YandexResearch、HSE大学、华盛顿大学、HuggingFace、巴黎-萨克雷高等经济学院和Yandex数据分析学院合作开发。
荐拯救被「掰弯」的GPT-4！西交微软北大联合提出IN2训练治疗LLM「中间迷失」

【新智元导读】近日，西交微软北大联合提出信息密集型训练大法，使用纯数据驱动的方式，矫正LLM训练过程产生的偏见，在一定程度上治疗了大语言模型丢失中间信息的问题。辛辛苦苦给大语言模型输入了一大堆提示，它却只记住了开头和结尾?这个现象叫做LLM的中间迷失，是大模型当前仍面临的最大挑战之一。以宽松的匹配准确性作为衡量标准:如果响应中的标签或描述完全匹配，则给出1分，否则为0分。

GPT-4 LLM
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

RefuelAI最近宣布推出两个新版本的大型语言模型，RefuelLLM-2和RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务设计，旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息，如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案，有助于自动化和优化大规模数据处理流程。

RefuelLLM-2
荐 LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值等问题，目前模型的上下文窗口大多不超过128k个token最近，MicrosoftResearch的研究人员提出了一个新模型LongRoPE，首次将预训练LLM的上下文窗口扩展到了2048k个token，在256k的训练长度下只需要1000个微调步骤即可，同时还能保持原始短上下文窗口的性能。论文链接:https://arxiv

LLM
微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

微软研究人员提出的LongRoPE方法首次将预训练的大型语言模型的上下文窗口扩展至2048k个token，实现了8倍的扩展同时保持原始短上下文窗口的性能无需进行架构变化和复杂微调。该方法的关键创新点包括通过高效搜索识别并利用了位置插值中的两种非均匀性，为微调提供更好的初始化，并在非微调情况下实现了8倍扩展;引入了渐进扩展策略，首先微调256k长度的LLM，然后在微调扩�

LongRoP LLM AI头条
荐今日AI：GPT4强敌Inflection-2.5模型发布；Midjourney要推中国版APP；MovieLLM一句话生成电影

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

Inflection
Design2Code：提供设计图，让多模态LLM自动生成前端代码

生成AI在多模态理解和代码生成方面取得了显著进展，为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务的系统研究。详细的细分指标表明，开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后在文本内容和着色方面则可以通过适当的微调得到显著改进。

Design2Code AI头条
荐模型融合、混合专家、更小的LLM，几篇论文看懂2024年LLM发展方向

在过去的2023年中，大型语言模型在潜力和复杂性方面都获得了飞速的发展。展望2024年的开源和研究进展，似乎我们即将进入一个可喜的新阶段:在不增大模型规模的前提下让模型变得更好，甚至让模型变得更小。论文标题:Astraios:Parameter-EfficientInstructionTuningCodeLargeLanguageModels论文地址:https://arxiv.org/abs/2401.00788这篇论文评估了不同的全微调和参数高效型微调技术，并且发现全微调�

LLM
比OpenAI官方提示词指南更全，这26条黄金准则让LLM性能飙升50%以上

穆罕默德・本・扎耶德人工智能大学VILALab带来了一项关于如何更好地为不同规模的大模型书写提示词的研究，让大模型性能在不需要任何额外训练的前提下轻松提升50%以上。该工作在X、Reddit和LinkedIn等平台上都引起了广泛的讨论和关注。更多提示词原则使用方法和说明，欢迎阅读原文。

OpenAI 提示词 AI头条
谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍

谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPUv5p人工智能芯片比以往任何时候都更快、更大、更宽，甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时，也发布了其最新版本的旗舰张量处理单元，用于人工智能的训练和推理，这似乎是一种挑战英伟达自己的市场领先的图形处理器的尝试。粗略的计算表明，TPUv5p大约比A100快3.4到4.8倍，这使得它与H100相当或者更优秀，尽管在得出任何结论之前，需要更详细的基准测试。

谷歌人工智能芯片英伟达
荐 Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

【新智元导读】AI训AI必将成为一大趋势。Meta和NYU团队提出让大模型「自我奖励」的方法，让Llama2一举击败GPT-40613、Claude2、GeminiPro领先模型。还有人表示「令人惊讶的是，每次迭代的改进几乎保持线性，仅在3次迭代之后，就已经接近GPT-4级别」。

GPT-4
荐拆掉英伟达护城河，细节曝光！世界最快超算用3072块AMD GPU训完超万亿参数LLM

用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。位于美国橡树岭国家实验室的全世界最大的超算Frontier，集合了37888个MI250XGPU和9472个Epyc7A53CPU。整个系统拥有602112个CPU核心，4.6PBDDR4内存。

GPT
荐 Hugging Face：2023开源LLM大爆发，数据竞赛已开启！

2023年的LLM开源社区都发生了什么?来自HuggingFace的研究员带你回顾并重新认识开源LLM2023年的大语言模型，让几乎所有人都燃起了热情。现在大多数人都知道LLM是什么，以及可以做什么。常用的方法包括bitsandbytes、GPTQ和AWQ。

大模型
荐 2080 Ti就能跑70B大模型，上交大新框架让LLM推理增速11倍

原本需要一张16万元的80GA100干的活，现在只需要一张不到2万元的24G4090就够了!上海交大IPADS实验室推出的开源推理框架PowerInfer，让大模型推理速度加快了11倍。且不用量化，就用FP16精度，也能让40B模型在个人电脑上运行;如果加入量化，2080Ti也能流畅运行70B模型。现有的云端CPU也有强大的AMX计算单元支持，通过利用CPU、GPU间的异构特征，可以乐观地认为PowerInfer能够使用更少的高

大模型
荐谷歌10秒视频生成模型破世界记录！LLM终结扩散模型，效果碾压顶流Gen-2

【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2可进行音频生成，风格转化。AI视频生成，或许就是2024年下一个最前沿的领域。对于未来的研究方向，谷歌研究人员表示，VideoPoet框架将会实现「any-to-any」的生成，比如扩展文本到音频、音频到视频，以及视频字幕等等。

视频生成模型
荐人形机器人+LLMs=? 答案就在这个2分钟视频里

图源备注：图片由AI生成，图片授权服务商Midjourney你可以用自然语言与机器人交谈，并要求它完成一项任务。未来对机器人的控制可能会像骑马，你可以把AI看作是骑手，机器人的物理智能就是马。未来的机器人的行动不会那么机械，动作会更流畅，就像人类。

人形机器人 LLMs
智谱AI发布中文 LLM 对齐评测基准AlignBench

智谱AI发布了专为中文大语言模型生的对齐评测基准AlignBench，这是目前第一个针对中文大模型的评测基准，能够在多维度上细致评测模型和人类意图的对齐水平。AlignBench的数据集来自于真实的使用场景，经过初步构造、敏感性筛查、参考答案生成和难度筛选等步骤，确保具有真实性和挑战性。通过登录AlignBench网站，提交结果可以使用CritiqueLLM作为评分模型进行评测，大约5分钟即可得到评测结果。
Perplexity发布两款LLM模型:pplx-7b-online和pplx-70b-online 可利用实时互联网数据查询

PerplexityAI，一家创新的人工智能初创公司，近日推出了一项能够改变信息检索系统的解决方案。该公司推出了两款新的大语言模型，分别是pplx-7b-online和pplx-70b-online，标志着首次通过API公开访问在线LLMs。通过API引入pplx-7b-online和pplx-70b-online模型解决了现有离线LLMs的局限性，并展示了在提供准确、实时和真实信息方面的卓越性能。

Perplexity LLM模型
Inflection推Inflection-2：号称全球计算级别最佳AI模型及全球第二最强大LLM

InflectionAI最近推出的语言模型Inflection-2，被宣称为全球计算级别最佳的AI模型，位列全球第二最强大的大型语言模型，仅次于OpenAI的最新模型。这一创新的AI模型的开发是为了满足对能够在各种任务中理解和生成类似人类文本的AI应用不断增长的需求。今年6月份，被视为OpenAI竞争对手的人工智能初创公司InflectionAI宣布完成13亿美元融资，融资由微软、LinkedIn联合创始人雷德·霍夫曼、微软公司联合创始人比尔·盖茨、谷歌前CEO埃里克·施密特等领头企业领投，英伟达等公司也参投。

Inflection-2 Inflection AI模型
挑战OpenAI！Claude 2.1 LLM长下文窗口可达200K

Anthropic最新发布的大型语言模型Claude2.1LLM引起了广泛关注，该模型的上下文窗口长度可达200K，是对当前市场主流模型的一次重要突破。这一消息是在OpenAI推出128K上下文窗口的GPT-4之后发布的，导致超过100个企业OpenAI用户周末纷纷向Anthropic寻求支持，以解决对LLM提供商的过度依赖问题。Anthropic的Claude2.1LLM的推出标志着语言模型领域的不断创新和竞争的升级，为用户提供了更丰富�

Claude AI头条
荐丢掉 LangChain、像 Docker一样编排大模型应用程序：这支十余人的年轻创业团队如何在2个月做出一个LLMOps平台？

大模型浪潮正在重构千行百业。可以预见的是，随着技术的不断进步以及应用场景的不断扩展，基于大模型的AI应用将会不断涌现，并成为推动AI产业发展的重要力量。曾在腾讯云CODINGDevOps团队负责产品及运营管理工作，服务超百万开发者用户的平台产品。

LLMOps
荐 0.2美元微调就能让ChatGPT彻底破防！普林斯顿、斯坦福发布LLM风险预警：普通用户微调也影响LLM安全性

【新智元导读】微调LLM需谨慎，用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!虽说预训练语言模型可以在零样本设置下，对新任务实现非常好的泛化性能，但在现实应用时，往往还需要针对特定用例对模型进行微调。微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?提供LLM服务的厂商也需要考虑到，当给终端用户开放模型微调权限后，安全性是否会下降?最近，普林斯顿大学、IBM、斯坦福等机构通过redteam实验证明，只需要几个恶意样本即可大幅降低预训练模型的安全性，甚至普通用户的微调也会影响模型的安全性。不管真正的原因是什么，研究人员假设，如果能够在未来的对齐工作中巩固那些不太稳健的危害类别，可能能够进一步提高良性微调情况下的整体安全性。

ChatGPT LLM
2行代码，「三体」一次读完！港中文贾佳亚团队联手MIT发布超长文本扩展技术，打破LLM遗忘魔咒

【新智元导读】大模型上下文从此不再受限!港中文贾佳亚团队联手MIT发布了全新超长文本扩展技术LongLoRA，只需2行代码，让LLM看小说，读论文，轻松拿捏。中途迷失、模型偷懒、上下文越长大模型越笨……体验过LLM的人，多少都会对文本输入长度带来的限制有所感触:实际上，这些都是典型的大语言模型对话缺陷。相距不过短短两个月，不得不说，这研究速度和能力跟LongLoRA一样惊人。

LongLoRA
荐 CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

大语言模型黑盒，居然被CMU等机构的学者打破了?他们发现，LLM内部有可解释的表征，如果撒谎能被测谎仪检测出来!最近，来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现——大语言模型，并不仅仅是黑匣子，或者难以理解的庞大矩阵。在它们内部，具有可解释的内部表征。CMU等机构研究者的探索也告诉我们，人类对于AI系统的理解和控制会越

大语言模型 Llama
exllamav2：一个用于在现代消费 GPU 上运行本地 LLM 的推理库

exllamav2是一个用于在现代消费级GPU上本地运行大型语言模型的快速推理库。它能够利用最新的GPU技术，在不牺牲太多质量的情况下，以非常快的速度对巨大的神经网络进行推理。随着它的不断发展和优化，相信它一定会让LLM的应用变得更加普及。

exllamav2 LLM
华人团队推出Medusa简单框架可将LLM推理速度提高2倍

来自普林斯顿、UIUC等机构的华人团队提出一个用于加速大型语言模型推理速度的简单框架Medusa，并于9月12日开源发布。测试结果显示，Medusa可以将LLM的生成效率提高约2倍。研究人员称正在积极扩展Medusa的应用场景，集成到更多的推理框架中，以获得更高的性能提升。

Medusa

热文

3 天
7天

LLMLingua2

与“LLMLingua2”的相关热搜词：

相关“LLMLingua2” 的资讯410篇

热文

站长商机