上下文

【新智元导读】模仿人类阅读过程，先分段摘要再回忆，谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能，有效上下文提升了3-20倍。基于Transformer的大语言模型具有很强的语言理解能力，但LLM一次能够读取的文本量仍然受到极大限制。还可以看到ReadAgentS大大优于ReadAgent-P，性能改进的代价是检索阶段的请求数量增加了六倍。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“上下文”的相关热搜词：

相关“上下文” 的资讯86篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐「有效上下文」提升20倍！DeepMind发布ReadAgent框架

【新智元导读】模仿人类阅读过程，先分段摘要再回忆，谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能，有效上下文提升了3-20倍。基于Transformer的大语言模型具有很强的语言理解能力，但LLM一次能够读取的文本量仍然受到极大限制。还可以看到ReadAgentS大大优于ReadAgent-P，性能改进的代价是检索阶段的请求数量增加了六倍。

DeepMind ReadAgent
首个开源世界模型LWM ：百万级上下文，长视频理解超GPT-4

来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型，被称为LWM系列模型。这一模型采用了大量视频和书籍数据集，通过RingAttention技术实现了长序列的可扩展训练，使得模型的上下文长度达到了1Mtoken。其优秀的性能表现和开源特性吸引了众多开发者的关注和参与，为人工智能领域的进步和创新带来了新的契机。

LWM GPT-4 AI头条
多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际，一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现，随着窗口长度的不断增加，大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude2是开源的Llama2和Mistral，都未能幸免。目前尚未找到既能完美解决问题又不显著影响模型效果的办法，Anthropic选择发布通告将这项研究公之于众，也是为了让整个业界都能关注这个�

Anthropic GPT AI
苹果开发出能看懂屏幕上下文的人工智能技术ReALM

苹果开发出了一项能够实时理解和识别用户屏幕上显示内容的人工智能技术无需依赖屏幕截图或图像数据输入。这项技术被称为ReALM，它使得在与用户交流的过程中，智能助手能够看到用户所看到的一切内容，并理解用户当前正在进行的活动，从随时提供帮助。当结合其他最近的苹果研究论文，允许“一次性”响应——即AI可以从单个提示中获得答案——这表明苹果仍在大力投资于AI助手领域不仅仅依赖外部模型。

苹果 ReALM AI头条
80M参数打平GPT-4！苹果发超强上下文理解模型ReALM，聪明版Siri马上就来

【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM，能够将各种形式的上下文转换为文本进行理解，包括解析屏幕、多轮对话以及上下文引用，提升了Siri等智能助手的反应速度和智能程度。会读心的Siri想不想要?今天，苹果发布了自家的最新模型ReALM，仅需80M参数，就能在上下文理解能力上打平甚至超越GPT-4!论文地址:https://arxiv.org/pdf/2403.20329.pdfReALM可以将任何形式的上下文转换为文本来进行理解，比如解析屏幕、多轮对话、以及上下文中的引用。随着模型大小的增加，所有数据集的性能都有所提高屏幕相关数据集的差异最为明显，因为这项任务在本质上更加复杂。

ReALM Siri
马斯克突然发布Grok 1.5！上下文长度飙升16倍和GPT-4齐平

就在刚刚，埃隆马斯克旗下的人工智能初创公司xAI宣布正式推出Grok-1.5，官方推送啥也没说，直接甩链接，主打一个字少事大”。Grok-1.5有哪些升级呢，主要是两个方面：1、长上下文理解对于上下文窗口，Grok-1.5直接提升到了之前的16倍，从8192增长到128k，和GPT-4齐平。Grok-1.5在HumanEval基准测试上得分74.1%，超越中杯Claude3Sonnet、GeminiPro1.5、GPT-4，仅次于大杯Claude3Opus。

人工智能 Grok-1.5 上下文理解
X AI 发布Grok-1.5更新：性能显著提升支持128K上下文长度

XAI发布了其最新的大型语言模型更新——Grok-1.5。该版本在编码和与数学相关的任务中表现出了显著的性能提升。我们期待看到这些新功能在未来几天的发布，以及它们将如何改变我们对大型语言模型的认知和使用。

Grok1.5 AI头条
AI21发布世界首个Mamba的生产级模型Jamba 支持256K上下文长度

AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构，具有52B参数，其中12B在生成时处于活动状态。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时，既能保持高效率，又不会牺牲性能或精度。

Jamba AI头条
Mistral 7B v0.2 基模型开源，支持32K上下文

MistralAI最新开源了Mistral7Bv0.2BaseModel，在一个名为CerebralValley的黑客松活动上宣布。这次更新将上下文提升到32K，取消了滑动窗口，同时设置了RopeTheta为1e6。MistralAI将继续努力，与同行竞争，并为客户提供更优质的人工智能解决方案。

Mistral7Bv0.2 AI头条
Gemini Pro 1.5及其百万上下文功能现已向所有人开放

备受期待的GeminiPro1.5以及其百万上下文功能已经向所有用户开放。这一新功能的推出，无疑将为AI领域的应用带来更多可能性。我们期待看到更多的创新和突破。

Gemini AI头条
Kimi AI智能助手体验入口 200万字无损上下文聊天机器人免费使用地址

KimiAI智能助手是由月之暗面科技推出的一款智能聊天机器人APP，旨在通过其大容量知识库提供智能闲聊、解答问题和生活助手服务。KimiAI智能助手拥有高度的智能交互能力，可以让用户随时随地与之聊天，寻找乐趣。为了体验「KimiAI智能助手」的强大功能，请访问网站查看更多介绍。

KimiAI智能助手 kimichat
荐百万token上下文窗口也杀不死向量数据库？CPU笑了

“Claude3、Gemini1.5，是要把RAG给搞死了吗?”随着新晋大语言模型们的上下文窗口变得越发得长，业界人士针对“RAG终将消亡”观点的讨论也是愈演愈烈。之所以如此，是因为它们二者都是为了解决大模型的幻觉问题，可以说是属于两种不同顶尖技术流派之间的对峙。更多CPU支持向量数据库的解决方案内容，请点击“阅读原文”获取。

token 向量数据库
一口气读完甄嬛传剧本、大部头医书：月之暗面200万字上下文Kimi开启内测

月之暗面把AI模型支持的上下文长度提升了一个数量级，实现了200万字上下文的「无损压缩」。一个能读200万字的AI助手是什么概念?这意味着，它可以一口气读完整个《甄嬛传》剧本，然后和你讨论剧情。如果你也有对超长无损上下文能力的需求，可到Kimi智能助手网页版kimi.ai首页申请抢先体验。

Kimi 月之暗面 AI头条
Kimi智能助手宣布支持200万字无损上下文，不到半年提升10倍

2024年3月18日，通用人工智能创业公司——月之暗面宣布在大模型长上下文窗口技术上取得新的突破，Kimi 智能助手已支持200万字超长无损上下文，并于即日起开启产品“内测”。对大模型超长无损上下文能力有需求的用户，可到Kimi智能助手网页版kimi.ai 首页申请抢先体验。3月18日启动200万字超长上下文的内测申请后，月之暗面会逐步开放更多用户来体验具备超长无损上�

人工智能大模型长上下文窗口技术月之暗面
荐今日AI：马斯克开源最大模型Grok-1；不等OpenAI！国产类Sora抢先开源；iPhone很快可直接使用Gemini模型；Kimi Chat超长上下文免费用

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/📰🤖📢AI新鲜事马斯克开源Grok-1:3140亿参数迄今最大，权重架构全开放【AiBase提要:】🚀马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。⭐OpenRouter�

Grok-1
月之暗面开放Kimi Chat 200 万字上下文的内测申请

月之暗面近日宣布，其智能助手KimiChat已开放200万字上下文的内测申请，引发了广大用户的热烈关注。作为MoonshotAI公司的产品，KimiChat以其超大的内存和强大的功能吸引了众多用户的目光。KimiChat已经开放了内测申请，对此感兴趣的用户可以申请试用，体验KimiChat带来的便捷和高效。

KimiChat 月之暗面 AI头条
荐零一万物API开放平台出场！通用Chat多模态通通开放，还有200K超长上下文版本

3月，国内外模型公司动作频频。国产大模型独角兽“五小虎”之一零一万物也有诸多新动作。具体推出的节奏，零一万物此次没有透露。

零一万物API 人工智能 AI
企业级语言模型Command-R发布：专注RAG和工具使用支持长达128k的上下文

Cohere团队于2024年3月11日发布了Command-R，一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成和工具使用，是可扩展的生成模型，旨在帮助企业从概念验证迈向实际生产。期待用户对Command-R的反馈，并期待在未来提供更多可扩展的模型，助力企业成功迈向生产规模的人工智能应用。

Command-R
斯坦福大学研究人员发布新机器学习方法C3PO：根据上下文定制大型语言模型

斯坦福大学的研究人员最近发布了一种名为C3PO的新方法，旨在解决语言模型定制化面临的挑战。在人工智能领域不断发展的今天，语言模型的定制化对于确保用户满意度至关重要。这项研究的意义超出了技术成就的范畴，预示着人工智能可以无缝适应个人偏好、增强其实用性和可访问性的未来。

C3PO 大语言模型 AI头条
谷歌10M上下文窗口正在杀死RAG？被Sora夺走风头的Gemini被低估了？

RAG还有存在的必要吗?要说最近最郁闷的公司，谷歌肯定算得上一个:自家的Gemini1.5刚刚发布，就被OpenAI的Sora抢尽了风头，堪称AI界的「汪峰」。谷歌这次推出的是用于早期测试的Gemini1.5的第一个版本——Gemini1.5Pro。下面是相应幻灯片的快照:@elvis表示，他已经开始着手进行第二轮测试，感兴趣的同学可以去X平台上围观。

Gemini 谷歌 Sora
零一万物发布 Yi 大模型 API 并启动公测：支持上下文 200K

零一万物发布了Yi大模型API，并启动了公测。这次邀测提供了两种模型:Yi-34B-Chat和Yi-34B-Chat-200K。Yi大模型API与OpenAIAPI完全兼容，可以平滑迁移，享受Yi大模型的超凡魅力。
谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性

GoogleGemini1.5推出了一项令人瞩目的技术突破，该版本引入了一个拥有高达一百万个令牌的上下文窗口功能。这项新功能旨在处理完整的书籍甚至电影，其准确性关注。如果其可靠性低于90%，那么实际中的巨大容量的上下文窗口运用中可能并不具备专业的帮助。
Gemini一眼识破Sora视频是AI生成？百万token上下文能力碾压GPT-4

【新智元导读】Gemini1.5的真实水平到底怎么样，从谷歌那里获得试用资格的大佬们，给大家进行了一波极限测试。让我们看看谷歌最新推出的大模型到底有多强的实力。在这个测试中，Gemini1.5Pro在较短的文本长度上的性能超过了GPT-4-Turbo，并且在整个100万token的范围内保持了相对稳定的表现与之对比鲜明的是，GPT-4Turbo的性能则飞速下降，且无法处理超过128，000token的文本，表现惨烈。

Gemini
书生·浦语2. 0 正式开源支持200K超长上下文

新一代200亿「书生·浦语2.0」是一款开源的大语言模型。它支持200K超长上下文，且20B版本在数学推理方面的性能超越了ChatGPT。整体表现上，InternLM2达到了与ChatGPT比肩的水平。

书生·浦语 AI头条
四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

只要四行代码就能让大模型窗口长度暴增，最高可增加3倍!且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型就能摇身一变，成为LongLM。SE的原作者也说，目前SE方法的确还没有做过效率方面的优化，未来计划通过引入FlashAttention机制等策略来解决这一问题。

Mistral 大模型
音乐生成深度学习模型StemGen：听取音乐上下文生成音乐作品

字节跳动AI研究团队最近推出了一项名为StemGen的音乐生成项目，该项目采用了一种创新的深度学习方法，旨在让模型能够模仿现有音乐中的模式和结构，并以一种非常前卫的方式回应音乐背景。与常用的深度学习技术不同，StemGen采用了一种非自回归、基于Transformer的模型，强调对音乐背景的听取和响应不是依赖于抽象的条件。通过MeanOpinionScore测试确认了该模型生成逼真音乐结果的能力。

StemGen AI头条
荐一句话解锁100k+上下文大模型真实力，27分涨到98，GPT-4、Claude2.1适用

各家大模型纷纷卷起上下文窗口，Llama-1时标配还是2k，现在不超过100k的已经不好意思出门了。然鹅一项极限测试却发现，大部分人用法都不对，没发挥出AI应有的实力。月之暗面的工程师还搞了更多轮实验，其中一个居然是……坏了，我成测试数据了。

大模型
LeCun发文质疑LLM推理能力大模型涌现离不开上下文学习

LeCun在推特上引发了关于大语言模型推理能力的讨论，强调LLM缺乏真正的规划推理能力，其涌现能力实际上是上下文学习的结果。研究通过多个实验验证LLM在复杂规划任务上表现不佳，强调其能力受限于任务复杂度。随着对LLM的研究的不断深入，对其真实能力的理解也在逐渐清晰，为未来自然语言处理研究方向提供了有价值的参考。

大模型
LongQLoRA：提升LLMs上下文理解能力

GitHub上一个名为LongQLoRA的新工具引发关注。它的作用是让LLMs能够理解更长的序列。这对于开发者和研究人员来说是一个好消息，他们可以利用这个工具来提升他们的LLMs模型的性能，进在自然语言处理领域取得更好的成绩。

LongQLoRA
李开复领队开源大模型 Yi，40万字上下文窗口破纪录

由李开复博士亲自下场创办的零一万物，自3月底官宣成立后，于近日发布并开源了两个版本的中英文大模型Yi-6B和Yi-34B。在线上发布环节，李开复博士重点介绍了Yi系列大模型的三处性能亮点:全球最长200K上下文窗口，免费开源超强AlInfra实测训练，成本下降40%科学训模自研「规模化训练实验平台」Yi-34B目前在各个基准测试中，都获得了很好的表现，据零一万物提供的评测结果看来，Yi-34B和Yi-6B均在MMLU、BBH、C-Eval取得了不错的成绩。零一万物相信AI赋能推动人类社会前行，AI应本着以人为本的精神，为人类创造巨大的价值。

李开复

热文

3 天
7天

上下文

与“上下文”的相关热搜词：

相关“上下文” 的资讯86篇

热文

站长商机