11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
清华和微软的研究人员提出了一种全新的方法,能在保证输出质量不变的前提下,将提示词压缩到原始长度的20%!在自然语言处理中,有很多信息其实是重复的。如果能将提示词进行有效地压缩,某种程度上也相当于扩大了模型支持上下文的长度。GPT-4可以有效地重建原始提示,这表明在LLMLingua-2压缩过程中并没有丢失基本信息。
微软研究发布了名为LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从降低成本和延迟。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。
对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。这个极限究竟有多大?清华大学和哈工大的一项联合研究给出的答案是:90%。作者进一步分析了这种极低比特量化模型的能力和前景,并为未来的研究提供了指导。
近日谷歌官方发布公告表示,Chrome开发团队正着手在浏览器上实现共享字典压缩技术,可让网站加载效率提升90%以上。开发者现在可在网站中,开始尝试采用Brotli或ZStandard压缩算法的共享字典,以测试该技术对网站性能的影响。且Chrome团队还指出,在最新的共享字典压缩方案中,已经解决了此前存在的安全性问题,且无论是动态还是静态资源都可获得益处。
清华大学和哈尔滨工业大学联合发布了一篇论文,成功将大模型压缩到1bit,仍保持83%的性能。这一成果标志着量化模型领域的一次重大突破。随着技术的不断进步,将有望实现将大型语言模型等大模型压缩到极低位宽,并实现在移动设备上高效运行的愿景。
微软和苏黎世联邦理工学院的研究人员联合开源了SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25%左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT成功应用于多个大型模型,如LLAMA-270B、OPT66B和Phi-2。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。
WhisperKit是一个专为自动语音识别模型压缩与优化设计的强大工具。它不仅支持对模型进行压缩和优化提供详细的性能评估数据。通过WhisperKit官网,您可以详细了解该工具的功能和应用,并体验其卓越的自动语音识别模型优化能力。
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICEGPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。
微软日前发布了最新的Windows11CanaryBuild26040预览版更新。Windows11进一步增强了压缩文件的能力。点击后会弹出一个全新的向导页面,让用户可以选择以下选项进行压缩:1、压缩目标目录2、压缩格式:包括7zip、TAR和ZIP;3、压缩算法/方式:包括Store、Deflate、BZip2、LZMA1、LZMA2、PPMd等,具体取决于所选择的压缩格式;4、压缩等级:从0到9;5、是否保留符号链接和硬链接下的其他内容。
美光推出业界首款标准低功耗压缩附加内存模块,容量从16GB到64GB不等。目前LPCAMM2内存模块已经出样,并计划在2024年上半年投产,这是自1997年推出SO-DIMM规格以来,客户端PC首次引入颠覆性新外形尺寸。与DDR5内存模块一样,LPCAMM2内存模块也带有电源管理IC和电压调节电路,为模块制造商降低产品功耗提供了更多途径。
近日,天眼查App公布了两起侵害发明专利权纠纷案件的一审判决书,两起案件涉及奥克斯空调股份有限公司与珠海格力电器股份有限公司。浙江省杭州市中级人民法院公布判决书显示,原告奥克斯公司以压缩机”发明专利权被侵害为由提起诉讼,要求被告格力公司分别赔偿经济损失及合理维权开支共计3996.17万元和3332万元。法院分别判决格力电器公司,赔偿奥克斯公司经济损失及合理费用3303万元和2546万元。
微软的研究团队开发了一种名为LLMLingua的独特粗细压缩技术,旨在解决大型语言模型中长提示带来的问题。LLMs以其强大的泛化和推理能力显著推动了人工智能领域的发展,展示了自然语言处理、自然语言生成、计算机视觉等方面的能力。该方法表现出色,并提供了一种改善LLM应用程序的效果和可负担性的有用方式。
上海科技大学、NeuDim、字节跳动和DGene的研究团队共同发布了一篇名为《HiFi4G:人体建模和高效渲染的突破性进展》的AI论文。该论文介绍了HiFi4G,这是一种全新的、全显式且紧凑的高斯方法,用于从密集视频中重新创建高保真的4D人体表演。用户在虚拟环境中进行各种活动时,可以获得更具沉浸感的体验。
在数字化时代,图片是我们日常生活和工作中不可或缺的一部分。随着高分辨率设备和摄像头的普及,图片文件的大小也越来越大,给存储和传输带来了诸多不便。访问即可开启您的轻松图片压缩之旅!
来自UC伯克利,港大等机构的研究人员,开创性地提出了一种「白盒」Transformer结构——CRATE。他们通过将数据从高维度分布压缩到低维结构分布,实现有效的表征,从进一步实现了有竞争力的模型性能。如果CKPT_DIR是None,则此脚本用于在CIFAR10上通过随机初始化来训练CRATE。
RNA3D结构预测是一个长期存在的挑战。受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了trRosettaRNA,这是一种基于深度学习的自动化RNA3D结构预测方法。为了克服对已知RNA折叠的偏见,可以利用神经网络来学习力场或识别/组装局部图案不是直接预测全局3D结构。
快科技11月10日消息,今年9月份,国家广播电视总局联合工信部、市场监管总局等有关单位宣布,将整治电视套娃”收费问题。今天下午,首都广电”官方公众号发文宣布,北京市治理电视套娃”收费和操作复杂试点工作取得阶段性成果。据介绍,在第一阶段治理工作中,歌华有线收费包压缩了79%,小米电视收费包压缩了58%,远超国家广电总局规定的压缩40%的目标。在治理操作
在上个月底的可选KB5031455更新中,微软添加了对11种压缩文件的解压支持,但仍不支持除zip外的压缩文件创建。但在最新的Windows11Canary预览版本中,微软添加了在没有第三方工具的情况下创建7z和tar压缩文件的功能,虽然仍不支持rar格式,但至少不再只局限于zip。”此外该版本还对SMB协议进行了更改、剪切工具中的HDR支持改进以及修复了一些已知问题。
联发科最新发布的一代旗舰级5G生成式AI移动芯片天玑9300,其创新的全大核架构设计与最新的AI处理器APU等联发科特色技术的合并,为生成式AI应用提供了强大的动力,以实现引人入胜、丰富多样的生成式AI体验。联发科也与大量的AI企业在业内进行深入合作,共同在移动平台上构造了一个充满活力的AI生态。联发科等生成式AI的领先者们正通过不断地技术革新和适当的生态布局,大力推动混合式AI计算,并为端侧生成式AI部署设计出了一套独自且高效的方法,全力以赴推进生成式AI在端侧的普及,旨在让更多的用户享受到端侧AI的个性化服务,带来全新的全方位智能体验,实现科技成果惠及全社会。
最新研究来自ISTA的科学家提出了一种创新的模型量化方法,称为QMoE,可以将庞大的1.6万亿参数SwitchTransformer压缩到令人难以置信的160GB以下,每个参数仅占用0.8位。这一方法实现了高达20倍的压缩率,为解决大型模型的高昂成本和内存需求问题提供了新的解决方案。这一创新性研究将有望为未来的深度学习和大型模型研究开辟新的方向。
在今年5月份的微软Build2023活动中,微软特别提到了将在Windows11系统中原生增加对RAR、7Z等压缩文件格式的解压支持。微软已通过本月的可选KB5031455预览累积更新添加了对11种压缩文件的解压支持,目前共支持.rar、.7z、.tar、.tar.gz、.tar.bz2、.tar.zst、.tar.xz、.tgz、.tbz2、.tzst和.txz等格式。另外这项新功能还将通过在11月份发布的PatchTuesday累积更新向所有Windows11用户推出。
在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。这充分证明LongLLMLingua可以在压缩提示的同时提升关键信息提取。
10月20日,国内最大的压缩机在新疆昌吉回族自治州的呼图壁储气库安装成功。有了这台压缩机,呼图壁储气库的日注气能力将从1600万立方米提升至2600万立方米,进一步提升我国天然气储气调峰和应急保供能力。它通过高速运转的叶轮,对气体进行增压,再注入地下进行储藏。
微信安全官方提醒,近期出现了专门针对卖家的骗局。诈骗份子冒充买家”,谎称需要下单,引卖家上钩。3、谎称付款异常,要求视频付款此类情况骗子常在线上付款时谎称付款码无法识别,要求商家打开视频方便扫描,并利用付款码”与收款码”界面切换的时间差,在受害人打开收付款”界面之后,第一时间扫描收款码”盗刷钱款。
大型语言模型的发展迅猛,BERT成为其中最受欢迎和高效的模型,但其复杂性和可扩展性成为问题。为了解决这些问题,市面上目前由三种常见的模型压缩技术:知识蒸馏、量化和剪枝。DistilBERT通过知识蒸馏技术在保持性能的同时显著压缩了大型语言模型,为在资源受限设备上的部署提供了可能性。
Google旗下的人工智能子公司DeepMind发布的一项研究表明,大型语言模型除了在文本数据处理方面表现出色之外具备出色的图像和音频数据压缩能力。这一发现为重新审视LLMs的潜力提供了新的角度。这表明LLMs的性能与数据集的大小有关,压缩率可以作为评估模型对数据集信息学习的指标。
StableDiffusion是目前最强开源文本生成图片的扩散模型之一,但对于那些没有A100、H100的中小企业、个人开发者来说有一个很大缺点,需要花费高昂的训练成本。为了解决这一痛点,Wuerstchen开源模型采用了一种全新的技术架构,在保证图片质量的情况下实现了42倍极限压缩。Wuerstchen生成图片展示根据Wuerstchen展示的案例,该模型对文本的理解能力非常好,生成的质量效果也能媲美StableDiffusion等目前最强开源扩散模型。
随着LLM的突破性工作逐渐放缓,对于如何让更多人使用LLM成为时下热门的研究方向,模型压缩可能是LLM未来的一个出路。此前OpenAI首席科学家IlyaSutskever表示可以通过压缩的视角来看待无监督学习。常用基准包括但不限于HULK和ELUE。
安装完新系统之后,大家第一件事往往会安装压缩软件,否则后续的软件安装就很麻烦,为此微软终于做个好事,新版Win11将原生支持RAR、7Z等常用格式解压缩。前几日微软已经推送了Beta预览版系统更新Build22621.2199和22631.2199,新版通过对开源项目libarchive的整合,实现了对tar、tar.gz、tar.bz2、tar.zst、tar.xz、tgz、tbz2、tzst、txz、rar、7z等主流压缩格式的原生支持。Win11原生支持多种�
近日,微软为Win11推送了Beta预览版系统更新Build22621.2199和22631.2199。和此前一致,此次更新22621.2199默认关闭新功能,22631.2199默认开启新功能。这些问题有望在9月该功能正式推送时解决。