压缩摘要

清华和微软的研究人员提出了一种全新的方法，能在保证输出质量不变的前提下，将提示词压缩到原始长度的20%!在自然语言处理中，有很多信息其实是重复的。如果能将提示词进行有效地压缩，某种程度上也相当于扩大了模型支持上下文的长度。GPT-4可以有效地重建原始提示，这表明在LLMLingua-2压缩过程中并没有丢失基本信息。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“压缩摘要”的相关热搜词：

相关“压缩摘要” 的资讯328篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐清华微软开源全新提示词压缩工具，长度骤降80%，GitHub怒砍3.1K星

清华和微软的研究人员提出了一种全新的方法，能在保证输出质量不变的前提下，将提示词压缩到原始长度的20%!在自然语言处理中，有很多信息其实是重复的。如果能将提示词进行有效地压缩，某种程度上也相当于扩大了模型支持上下文的长度。GPT-4可以有效地重建原始提示，这表明在LLMLingua-2压缩过程中并没有丢失基本信息。

自然语言处理信息熵方法数据精炼流程
微软新工具LLMLingua-2：可将 AI 提示压缩高达80%，节省时间和成本

微软研究发布了名为LLMLingua-2的模型，用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记，同时保留关键信息，使得提示长度可减少至原长度的20%，从降低成本和延迟。该公司认为这是一个有前途的方法，可以通过压缩提示实现更好的泛化能力和效率。

LLMLingua-2 微软 AI头条
荐让大模型“瘦身”90%！清华&哈工大提出极限压缩方案：1bit量化，能力同时保留83%

对大模型进行量化、剪枝等压缩操作，是部署时最常见不过的一环了。这个极限究竟有多大?清华大学和哈工大的一项联合研究给出的答案是:90%。作者进一步分析了这种极低比特量化模型的能力和前景，并为未来的研究提供了指导。

大模型
网站加载效率至少提升90%！谷歌Chrome测试共享字典压缩技术

近日谷歌官方发布公告表示，Chrome开发团队正着手在浏览器上实现共享字典压缩技术，可让网站加载效率提升90%以上。开发者现在可在网站中，开始尝试采用Brotli或ZStandard压缩算法的共享字典，以测试该技术对网站性能的影响。且Chrome团队还指出，在最新的共享字典压缩方案中，已经解决了此前存在的安全性问题，且无论是动态还是静态资源都可获得益处。

谷歌 Chrome 共享字典
清华、哈工大提出OneBit方法：可把大模型压缩到1bit 保持 83% 性能

清华大学和哈尔滨工业大学联合发布了一篇论文，成功将大模型压缩到1bit，仍保持83%的性能。这一成果标志着量化模型领域的一次重大突破。随着技术的不断进步，将有望实现将大型语言模型等大模型压缩到极低位宽，并实现在移动设备上高效运行的愿景。

OneBit 大模型 AI头条
微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

微软和苏黎世联邦理工学院的研究人员联合开源了SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25%左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT成功应用于多个大型模型，如LLAMA-270B、OPT66B和Phi-2。这一技术的推出，有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

SliceGPT AI头条
WhisperKit官网体验入口 AI自动语音识别模型压缩与优化工具在线使用地址

WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网，您可以详细了解该工具的功能和应用，并体验其卓越的自动语音识别模型优化能力。

WhisperKit
微软开发新型大模型压缩方法SliceGPT

SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICEGPT，可以在保持99%，99%，和90%零样本任务性能的同时，将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数。这种方法的核心优势在于，它允许模型在去除一定比例的参数后，仍然能够保持接近原始模型的性能，适用于资源受限的设备上部署大型模型，比如普通的个人电脑或者移动设备。

SliceGPT
Windows 11新功能来了：文件压缩更全面灵活

微软日前发布了最新的Windows11CanaryBuild26040预览版更新。Windows11进一步增强了压缩文件的能力。点击后会弹出一个全新的向导页面，让用户可以选择以下选项进行压缩：1、压缩目标目录2、压缩格式：包括7zip、TAR和ZIP；3、压缩算法/方式：包括Store、Deflate、BZip2、LZMA1、LZMA2、PPMd等，具体取决于所选择的压缩格式；4、压缩等级：从0到9；5、是否保留符号链接和硬链接下的其他内容。
业界首款！美光推出低功耗压缩附加内存模块：速率最高9600MT/s

美光推出业界首款标准低功耗压缩附加内存模块，容量从16GB到64GB不等。目前LPCAMM2内存模块已经出样，并计划在2024年上半年投产，这是自1997年推出SO-DIMM规格以来，客户端PC首次引入颠覆性新外形尺寸。与DDR5内存模块一样，LPCAMM2内存模块也带有电源管理IC和电压调节电路，为模块制造商降低产品功耗提供了更多途径。
奥克斯诉格力侵权获赔5849万：确认“压缩机”发明专利侵权

近日，天眼查App公布了两起侵害发明专利权纠纷案件的一审判决书，两起案件涉及奥克斯空调股份有限公司与珠海格力电器股份有限公司。浙江省杭州市中级人民法院公布判决书显示，原告奥克斯公司以压缩机”发明专利权被侵害为由提起诉讼，要求被告格力公司分别赔偿经济损失及合理维权开支共计3996.17万元和3332万元。法院分别判决格力电器公司，赔偿奥克斯公司经济损失及合理费用3303万元和2546万元。
20倍的压缩比例！微软发布LLMLingua:压缩长提示并加快模型推理速度

微软的研究团队开发了一种名为LLMLingua的独特粗细压缩技术，旨在解决大型语言模型中长提示带来的问题。LLMs以其强大的泛化和推理能力显著推动了人工智能领域的发展，展示了自然语言处理、自然语言生成、计算机视觉等方面的能力。该方法表现出色，并提供了一种改善LLM应用程序的效果和可负担性的有用方式。

LLMLingua 大模型 AI头条
25倍压缩率！HiFi4G渲染技术实现照片级真实人体建模和高效渲染

上海科技大学、NeuDim、字节跳动和DGene的研究团队共同发布了一篇名为《HiFi4G:人体建模和高效渲染的突破性进展》的AI论文。该论文介绍了HiFi4G，这是一种全新的、全显式且紧凑的高斯方法，用于从密集视频中重新创建高保真的4D人体表演。用户在虚拟环境中进行各种活动时，可以获得更具沉浸感的体验。

HiFi4G AI渲染
轻秒格式工厂：在线图片压缩，工作、生活便捷神器

在数字化时代，图片是我们日常生活和工作中不可或缺的一部分。随着高分辨率设备和摄像头的普及，图片文件的大小也越来越大，给存储和传输带来了诸多不便。访问即可开启您的轻松图片压缩之旅！
荐智能的本质就是压缩？马毅团队5年心血提出「白盒」Transformer，打开LLM黑盒！

来自UC伯克利，港大等机构的研究人员，开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布，实现有效的表征，从进一步实现了有竞争力的模型性能。如果CKPT_DIR是None，则此脚本用于在CIFAR10上通过随机初始化来训练CRATE。

Transformer
「GPT-4只是在压缩数据」，马毅团队造出白盒Transformer，可解释的大模型要来了吗？

RNA3D结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发，南开大学、山东大学以及北京理工大学的研究团队开发了trRosettaRNA，这是一种基于深度学习的自动化RNA3D结构预测方法。为了克服对已知RNA折叠的偏见，可以利用神经网络来学习力场或识别/组装局部图案不是直接预测全局3D结构。

Transformer
小米电视收费包压缩了58%！北京治理电视套娃收费等取得阶段性成果

快科技11月10日消息，今年9月份，国家广播电视总局联合工信部、市场监管总局等有关单位宣布，将整治电视套娃”收费问题。今天下午，首都广电”官方公众号发文宣布，北京市治理电视套娃”收费和操作复杂试点工作取得阶段性成果。据介绍，在第一阶段治理工作中，歌华有线收费包压缩了79%，小米电视收费包压缩了58%，远超国家广电总局规定的压缩40%的目标。在治理操作

小米电视智能电视电视广告
Win11史诗级更新！原生支持创建7z和tar压缩文件：不再局限于zip

在上个月底的可选KB5031455更新中，微软添加了对11种压缩文件的解压支持，但仍不支持除zip外的压缩文件创建。但在最新的Windows11Canary预览版本中，微软添加了在没有第三方工具的情况下创建7z和tar压缩文件的功能，虽然仍不支持rar格式，但至少不再只局限于zip。”此外该版本还对SMB协议进行了更改、剪切工具中的HDR支持改进以及修复了一些已知问题。
天玑9300支持内存硬件压缩技术，行业第一，让手机运行AI大模型更快速

联发科最新发布的一代旗舰级5G生成式AI移动芯片天玑9300，其创新的全大核架构设计与最新的AI处理器APU等联发科特色技术的合并，为生成式AI应用提供了强大的动力，以实现引人入胜、丰富多样的生成式AI体验。联发科也与大量的AI企业在业内进行深入合作，共同在移动平台上构造了一个充满活力的AI生态。联发科等生成式AI的领先者们正通过不断地技术革新和适当的生态布局，大力推动混合式AI计算，并为端侧生成式AI部署设计出了一套独自且高效的方法，全力以赴推进生成式AI在端侧的普及，旨在让更多的用户享受到端侧AI的个性化服务，带来全新的全方位智能体验，实现科技成果惠及全社会。
研究人员推出压缩框架QMoE：可将1.6万亿参数模型高效压缩20倍

最新研究来自ISTA的科学家提出了一种创新的模型量化方法，称为QMoE，可以将庞大的1.6万亿参数SwitchTransformer压缩到令人难以置信的160GB以下，每个参数仅占用0.8位。这一方法实现了高达20倍的压缩率，为解决大型模型的高昂成本和内存需求问题提供了新的解决方案。这一创新性研究将有望为未来的深度学习和大型模型研究开辟新的方向。

QMoE
迟到了28年的功能：Win11原生支持11种压缩格式包括7z RAR等

在今年5月份的微软Build2023活动中，微软特别提到了将在Windows11系统中原生增加对RAR、7Z等压缩文件格式的解压支持。微软已通过本月的可选KB5031455预览累积更新添加了对11种压缩文件的解压支持，目前共支持.rar、.7z、.tar、.tar.gz、.tar.bz2、.tar.zst、.tar.xz、.tgz、.tbz2、.tzst和.txz等格式。另外这项新功能还将通过在11月份发布的PatchTuesday累积更新向所有Windows11用户推出。
荐最高20倍！压缩ChatGPT等模型文本提示，极大节省AI算力

在长文本场景中，ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题，微软开源了LongLLMLingua。这充分证明LongLLMLingua可以在压缩提示的同时提升关键信息提取。

ChatGPT
国内最大压缩机安装成功：可存2600万立方米天然气

10月20日，国内最大的压缩机在新疆昌吉回族自治州的呼图壁储气库安装成功。有了这台压缩机，呼图壁储气库的日注气能力将从1600万立方米提升至2600万立方米，进一步提升我国天然气储气调峰和应急保供能力。它通过高速运转的叶轮，对气体进行增压，再注入地下进行储藏。
警惕微信三大新骗局：压缩文件竟是病毒

微信安全官方提醒，近期出现了专门针对卖家的骗局。诈骗份子冒充买家”，谎称需要下单，引卖家上钩。3、谎称付款异常，要求视频付款此类情况骗子常在线上付款时谎称付款码无法识别，要求商家打开视频方便扫描，并利用付款码”与收款码”界面切换的时间差，在受害人打开收付款”界面之后，第一时间扫描收款码”盗刷钱款。
DistilBERT：更小、更快、更便宜的大型语言模型压缩方法

大型语言模型的发展迅猛，BERT成为其中最受欢迎和高效的模型，但其复杂性和可扩展性成为问题。为了解决这些问题，市面上目前由三种常见的模型压缩技术:知识蒸馏、量化和剪枝。DistilBERT通过知识蒸馏技术在保持性能的同时显著压缩了大型语言模型，为在资源受限设备上的部署提供了可能性。

DistilBERT
DeepMind研究人员发现，深度学习模型在图像和音频压缩方面表现出色

Google旗下的人工智能子公司DeepMind发布的一项研究表明，大型语言模型除了在文本数据处理方面表现出色之外具备出色的图像和音频数据压缩能力。这一发现为重新审视LLMs的潜力提供了新的角度。这表明LLMs的性能与数据集的大小有关，压缩率可以作为评估模型对数据集信息学习的指标。

DeepMind 深度学习模型 AI头条
荐训练成本降低16倍，极限压缩42倍！开源文本生成图片模型

StableDiffusion是目前最强开源文本生成图片的扩散模型之一，但对于那些没有A100、H100的中小企业、个人开发者来说有一个很大缺点，需要花费高昂的训练成本。为了解决这一痛点，Wuerstchen开源模型采用了一种全新的技术架构，在保证图片质量的情况下实现了42倍极限压缩。Wuerstchen生成图片展示根据Wuerstchen展示的案例，该模型对文本的理解能力非常好，生成的质量效果也能媲美StableDiffusion等目前最强开源扩散模型。

模型
中国科学院团队首篇LLM模型压缩综述：细聊剪枝、知识蒸馏、量化技术

随着LLM的突破性工作逐渐放缓，对于如何让更多人使用LLM成为时下热门的研究方向，模型压缩可能是LLM未来的一个出路。此前OpenAI首席科学家IlyaSutskever表示可以通过压缩的视角来看待无监督学习。常用基准包括但不限于HULK和ELUE。

LLM
有用但别期待 Win11原生RAR/Z7Z压缩性能实测：速度实在太慢

安装完新系统之后，大家第一件事往往会安装压缩软件，否则后续的软件安装就很麻烦，为此微软终于做个好事，新版Win11将原生支持RAR、7Z等常用格式解压缩。前几日微软已经推送了Beta预览版系统更新Build22621.2199和22631.2199，新版通过对开源项目libarchive的整合，实现了对tar、tar.gz、tar.bz2、tar.zst、tar.xz、tgz、tbz2、tzst、txz、rar、7z等主流压缩格式的原生支持。Win11原生支持多种�
Win11 Beta预览版226x1.2199发布：实现对RAR、7z等压缩格式原生支持

近日，微软为Win11推送了Beta预览版系统更新Build22621.2199和22631.2199。和此前一致，此次更新22621.2199默认关闭新功能，22631.2199默认开启新功能。这些问题有望在9月该功能正式推送时解决。

Win11

热文

3 天
7天

压缩摘要

与“压缩摘要”的相关热搜词：

相关“压缩摘要” 的资讯328篇

热文

站长商机