基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍达3万个token

2023-08-25 11:39 · 稿源：站长之家

文章概要:
1. 研究人员扩展了开源 LLaMA 模型的上下文窗口，创建了 Giraffe，上下文窗口扩大10倍，达到约32，000个标记。
2. Giraffe适合需要处理数十页文本的商业应用，为大上下文语言模型研究提供了重要见解。
3.该研究还强调了当前技术的局限性以及定制测试的必要性，当前不足以衡量长上下文表现，需要定制测试。

站长之家（ChinaZ.com）8月25日消息:最近，研究人员使用插值技术将开源语言模型LLaMA的上下文窗口从原来的约3，200个token扩大了10倍，达到约32，000个token，由此开发出新的开源语言模型Giraffe。该版本有130亿个参数版本，并且拥有所有开源 LLM 中最大的上下文窗口之一。

黑客攻击代码电脑互联网

Giraffe适用于需要处理数十页文本的各种商业应用场景。像GPT-3这样的语言模型上下文窗口有限，对长文本理解能力较弱。而Giraffe具有更大的“记忆”，能更好地处理这样的用例。

作为开源研究，Giraffe研究还提供了对语言模型内部运作以及不同的上下文窗口扩大技术的重要见解。研究发现，位置嵌入的线性缩放对增加上下文长度最为有效。

研究同时也凸显了当前技术的局限性，因为准确率会随上下文窗口增加而下降。这表明仅用困惑度来衡量语言模型的表现是不够的，对长上下文任务需要定制化的测试。

目前，开源的Giraffe-v2-13b-32k模型已在Hugging Face平台上线，代码也在GitHub上开源。

项目网址:

https://github.com/abacusai/Long-Context

https://huggingface.co/abacusai/Giraffe-v2-13b-32k

（举报）

相关推荐

关键词：

荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

本文汇总了AI领域的最新动态：腾讯升级混元生图模型至2.1版，支持2K分辨率与中英文输入；爱诗科技获阿里领投6000万美元融资，聚焦AI视频生成；Freepik上线Seedream 4.0图像模型，提供高分辨率生成选项；阿里千问新模型通过MoE架构提升推理效率10倍；微软在Office 365中集成Anthropic技术，调整AI供应商策略；首款AI Agent浏览器Fellou CE发布，简化工作流程；清华团队开源GUAVA技术，实现

AI日报混元生图模型 2K分辨率
荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；迪士尼将起诉MiniMax

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、版权、开发工具等领域的快速演进与应用创新。

AI 开源轻量级
没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
三星正式向更多Galaxy设备推送Samsung One UI 8更新

三星电子正式推送One UI 8更新，为Galaxy用户带来增强的多模态AI功能，包括个性化建议、实时窗口、即时简报等智能体验。新系统优化了不同设备形态的交互，结合Knox安全架构保护隐私，并支持实时翻译、游戏辅助等实用工具。9月18日起中国用户可优先升级，年底前将扩展至更多机型。

AI功能个性化用户体验
三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

9月12日，三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展，集中展示搭载AI技术的全线产品，包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品，通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能，感受AI技术带来的生活便利。展览将持续至9月17日，并提供互动礼品。

三星家电 AI科技线下体验展
远东股份：ALL IN“电能+算力+AI”，智能驱动未来

远东股份（600869）凭借“电能+算力+AI”战略，在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术，自主研发高导铝绞线提升输电效率，产品应用于多条国家级特高压线路。同时布局液冷技术研发，为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设，助力制造业智能化升级和绿色高效算能模式构建。

人工智能能源算力
三星Galaxy Buds3 FE：音质、互联、设计全面升级

三星Galaxy Buds3FE耳机通过降噪、生态互联和标志性设计，将高端音频体验普及至更广泛用户。其增强型主动降噪技术可过滤环境噪音，超宽带通话技术确保清晰沟通。智能互联支持跨设备无缝切换，语音助手Bixby提升操作效率。刀锋设计搭配经典配色，兼顾时尚与舒适佩戴。作为三星生态重要成员，它精准匹配用户对音质、智能功能和性价比的升级需求。

耳机进化高品质音质清晰通话
荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

AI日报今日聚焦七大热点：小红书发布FireRedTTS-2语音合成模型，显著提升自然度；百度文心ERNIE-4.5登顶Hugging Face榜单；谷歌Gemini应用登顶美国免费榜；马斯克xAI裁员500人并战略转型；OpenAI拟大幅降低与微软分成比例；DeepMCPAgent开源框架提升AI代理生产力；蚂蚁发布AI开源全景图2.0；北京1400多所中小学推行人工智能通识课程。

AI 对话合成模型小红书
线上笔试/面试神器使用全攻略——面试猫AI，助你轻松拿offer！

面对岗位缩减、职场内卷加剧的求职困境，面试猫AI助手应运而生。该工具基于顶级GPT模型，提供实时语音识别、截图答题、个性化简历优化等全流程面试辅助。支持14种语言，覆盖主流视频会议平台，具备高安全性。用户可上传简历获取定制化面试回复，实现零准备高效应对各类笔试面试，显著提升求职成功率。

面试技巧求职策略 AI面试助手
Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

北京楼市新政落地，市场活力提升，新房装修需求升温。文章重点指出选购健康安全建材的关键指标：甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验，对比测试了乐迈石晶板等主流建材，结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能，重新定义了健康建材的标准。

北京楼市新政新房装修需求家装建材选择

今日大家都在搜的词：

热文

3 天
7天

基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍达3万个token

荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；迪士尼将起诉MiniMax

没想到，音频大模型开源最彻底的，居然是小红书

三星正式向更多Galaxy设备推送Samsung One UI 8更新

三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

远东股份：ALL IN“电能+算力+AI”，智能驱动未来

三星Galaxy Buds3 FE：音质、互联、设计全面升级

荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

线上笔试/面试神器使用全攻略——面试猫AI，助你轻松拿offer！

Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

今日大家都在搜的词：

热文

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

卢伟冰：9月19日将直播在线解答小米17系列17个问题

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

苹果承诺修复iPhone17拍照黑色方块、白色曲线等问题

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上热搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

尚界H5小订突破10万台预售16.98万起

理想i6定档9月26日上市：官方定义新形态五座SUV

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

站长商机

基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍 达3万个token

今日大家都在搜的词：

热文

站长商机

基于LLaMA!开源模型Giraffe将LLaMA上下文窗口扩大10倍达3万个token