微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

2024-04-29 13:56 · 稿源：站长之家

划重点:
⭐ LongRoPE 方法将 LLM 的上下文窗口扩展至2048k，无需架构变化 + 复杂微调
⭐ 通过高效搜索识别位置插值中的非均匀性，为微调提供更好初始化，展8倍而保持性能
⭐ 实验结果表明 LongRoPE 成功将 LLM 上下文窗口扩展至2048k，并在较短长度内保持与基线相当或更好的困惑度

站长之家（ChinaZ.com）4月29日消息:近日，微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型（LLM）的上下文窗口扩展至2048k 个 token，实现了8倍的扩展同时保持原始短上下文窗口的性能，而无需进行架构变化和复杂微调。

该方法的关键创新点包括通过高效搜索识别并利用了位置插值中的两种非均匀性，为微调提供更好的初始化，并在非微调情况下实现了8倍扩展;引入了渐进扩展策略，首先微调256k 长度的 LLM，然后在微调扩展的 LLM 上进行第二次位置插值，以实现2048k 上下文窗口;在8k 长度上重新调整 LongRoPE 以恢复短上下文窗口性能。

实验结果表明，LongRoPE 方法成功将 LLM 的上下文窗口扩展至2048k，并在256k 的范围内展现出整体困惑度下降的趋势，同时在较短长度内保持与基线相当或更好的困惑度。这一突破性的方法为语言模型的性能提升带来了新的可能性，也为未来的研究和应用奠定了坚实的基础。

产品入口：https://top.aibase.com/tool/longrope

论文链接:https://arxiv.org/abs/2402.13753

代码链接:https: //github.com/microsoft/LongRoPE

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值等问题，目前模型的上下文窗口大多不超过128k个token最近，MicrosoftResearch的研究人员提出了一个新模型LongRoPE，首次将预训练LLM的上下文窗口扩展到了2048k个token，在256k的训练长度下只需要1000个微调步骤即可，同时还能保持原始短上下文窗口的性能。论文链接:https://arxiv

LLM
谷歌硬刚GPT-4o，60秒视频生成模型虽迟但到，还把上下文窗口卷到了200万

OpenAI出手再次惊艳世界，谷歌果然坐不住了。GPT-4o掀起的一片“AGI已至”的惊呼声中，刚刚，GoogleDeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场:同样能会还有，不仅能几乎没有延迟地和人类流畅交流，通过摄像头，这个名为ProjectAstra的AI助手甚至能直接帮忙读代码谷歌还祭出了自己的硬件优势，带来一波AR和大模型的梦幻联动。有关谷歌I/O的更多细节，可以戳:https://blog.go

OpenAI Google GPT-4o
龙芯7A2000获驱动更新：GPU性能已达发布时2倍多！

龙芯中科在2022年7月推出7A2000芯片，首次集成了自研的GPU核心，经过持续的驱动更新，其GPU性能已经显著提升。随着统信在前不久发布的1070版UOS系统，龙芯7A2000的最新驱动得到集成，性能得到了进一步优化了。7A2000的GPU核心频率达到400-500MHz，支持OpenGL2.1和OpenGLES2.0规范，显存频率达到2000MHz-2400MHz，最大支持16GB，能够支持两路显示。

龙芯中科 GPU性能提升统信UOS系统
Fugaku-LLM有哪些功能免费吗？怎么使用方法详细教程指南

FugakuLLM 是什么FugakuLLM是一个专注于文本生成的人工智能模型由FugakuLLM团队开发它利用先进的机器学习技术能够生成流畅连贯的文本适用于多种语言和场景该模型在社区中拥有广泛的应用包括写作辅助聊天机器人开发和教育工具等FugakuLLM 有哪些功能文本生成能够生成流畅连贯的文本多语言支持适用于多种语言环境持续更新模型定期更新以保持技术领先社区活跃拥有活跃的社区支持和贡献高效率快速响应生成文本请求易于集成可以轻松集

Fugaku-LLM 文本生成人工智能模型
苹果万年不变的1200万超广角升级了！iPhone 16 Pro影像曝光

在iPhone14Pro系列中，苹果将主摄镜头的像素从1200万提升到了4800万，但超广角镜头仍然保持着1200万像素的水准。直至iPhone15Pro系列，1200万像素的超广角镜头仍然是苹果的标配。在iPhone上，空间视频以常规的二维视频形式呈现在VisionPro上，则以3D形式展示，呈现更为震撼的视觉效果。

iPhone 16 Pro
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2

RefuelAI最近宣布推出两个新版本的大型语言模型，RefuelLLM-2和RefuelLLM-2-small，这两个模型专为数据标注、清洗和丰富任务设计，旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息，如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案，有助于自动化和优化大规模数据处理流程。

RefuelLLM-2
腾讯开源混元DiT 图像生成模型可根据对话上下文生成并细化图像

腾讯开源了混元DiT图像生成模型，对英语和中文都有着精细的理解能力。Hunyuan-DiT能够进行多轮多模态对话，根据对话上下文生成并细化图像。它通过结合Transformer结构、文本编码和位置编码，以及训练一个多模态大型语言型，实现了对中英文的细粒度理解，并在图像生成等任务中取得了显著的效果。

DiT 图像生成模型 AI头条
谷歌Gemini 1.5 Pro面向全球开发者开放已支持200万tokens

GoogleI/O2024开发者大会在谷歌山景城总部附近的海岸线圆形剧场隆重开幕。在这场科技盛宴中，谷歌率先分享了Gemini大模型的最新突破。随着Gemini模型的进一步升级和扩展，我们有理由相信谷歌将继续引领AI技术的发展潮流，为开发者提供更加高效、智能的工具和平台。

Google I/O2024 Gemini大模型
FastGen：在不降低LLM质量的情况下降低GPU内存成本

研究人员来自伊利诺伊大学厄巴纳-香槟分校和微软提出了一种名为FastGen的高效技术，通过使用轻量级模型分析和自适应键值缓来提高LLM的推理效率不会降低可见质量。FastGen通过自适应的键值缓存构造来减少生成推理过程中的GPU内存使用量。未来的工作包括将FastGen与其他模型压缩方法进行整合。

FastGen LLM AI头条
OPPO Find N3/一加12升级新版ColorOS 14：应用分身暴增200多个

OPPO为OPPOFindN3、一加12等机型推送了新版ColorOS14系统。新版系统支持200多个应用分身，这一功能对于需要同时管理多个社交媒体、邮箱、购物等账号的用户来说非常实用。以下是更新详情：新增控制中心音量条，快速调节音量；新增支持200应用分身；新增支持锁屏图案解锁隐藏解锁轨迹；迷你浮窗新增上滑手势关闭；浮窗支持底部拖动调整大小；提升系统稳定性；更新Android安全补丁至2024年4月，提升系统安全性；新增大师模式，融入哈苏影调效果，拍出更优质、更具色彩感的照片，提升拍摄成片率。

OPPO ColorOS 14

今日大家都在搜的词：

热文

3 天
7天

微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

今日大家都在搜的词：

热文

站长商机