大模型长上下文窗口技术

今年2月初，谷歌发布的Gemini2.0Pro支持200万上下文，震惊了整个大模型领域。仅过了2个月，Meta最新开源的Llama4Scout就将上下文扩展至1000万，整整提升了5倍开启千万级时代。根据实验数据显示，Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“大模型长上下文窗口技术”的相关热搜词：

相关“大模型长上下文窗口技术” 的资讯10篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐 1000万上下文！新开源多模态大模型，单个GPU就能运行

今年2月初，谷歌发布的Gemini2.0Pro支持200万上下文，震惊了整个大模型领域。仅过了2个月，Meta最新开源的Llama4Scout就将上下文扩展至1000万，整整提升了5倍开启千万级时代。根据实验数据显示，Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

Gemini2.0Pro Llama4Scout 上下文扩展
荐 AI说书媲美真人！豆包语音大模型升级长上下文理解

下面的两个有声书演播片段，你能分辨是真人还是AI合成的吗?实际上这两个小说片段都是AI合成的，方案来自于豆包语音模型团队。为了逼近一流真人主播的演播效果，豆包语音模型基于原有Seed-TTS框架进一步加入上下文理解，最终实现了高表现力、高自然度、高语义理解的小说演播效果。未来豆包语音模型会继续探索前沿科技与业务场景的结合，追求更极致的“听”体验。

AI合成语音豆包语音模型小说演播技术
阿里云百炼上线Qwen2.5-Turbo模型：支持100万超长上下文

阿里云百炼宣布，最新的Qwen2.5-Turbo模型已在平台上线，即日起所有用户可在阿里云百炼调用Qwen2.5-TurboAPI，百万tokens仅需0.3元，同时还免费为用户赠送1000万tokens额度。该模型支持100万超长上下文，相当于100万个英文单词或150万个汉字，并且在多个长文本评测集中的性能表现超越GPT-4。不过通义千问团队也表示，长文本任务处理依然存在诸多挑战，未来将进一步探索长序列人类偏好对齐，优化推理效率以减少运算时间，并继续研发更大、更强的长文本模型。

阿里云 Qwen2.5-Turbo API调用
荐长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。这些差异可能是由于训练任务的变化造成的。

GPT-4o
Kimi首发“上下文缓存”技术，助推长文本大模型降本90%

近日，月之暗面宣布Kimi开放平台正式公测新技术——上下文缓存，该技术在API价格不变的前提下，可为开发者降低最高90%的长文本大模型使用成本，并且显著提升模型的响应速度。据了解，月之暗面是国内首家面向开发者推出上下文缓存技术的大模型公司。Kimi开放平台陆续上线了工具调用、PartialMode、上下文缓存等能力，持续帮助开发者高效打造更有想象力的AI应用。

月之暗面 Kimi 开放平台
谷歌硬刚GPT-4o，60秒视频生成模型虽迟但到，还把上下文窗口卷到了200万

OpenAI出手再次惊艳世界，谷歌果然坐不住了。GPT-4o掀起的一片“AGI已至”的惊呼声中，刚刚，GoogleDeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场:同样能会还有，不仅能几乎没有延迟地和人类流畅交流，通过摄像头，这个名为ProjectAstra的AI助手甚至能直接帮忙读代码谷歌还祭出了自己的硬件优势，带来一波AR和大模型的梦幻联动。有关谷歌I/O的更多细节，可以戳:https://blog.go

OpenAI Google GPT-4o
荐今日AI：马斯克开源最大模型Grok-1；不等OpenAI！国产类Sora抢先开源；iPhone很快可直接使用Gemini模型；Kimi Chat超长上下文免费用

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/📰🤖📢AI新鲜事马斯克开源Grok-1:3140亿参数迄今最大，权重架构全开放【AiBase提要:】🚀马斯克旗下xAI公司开源了3140亿参数的混合专家模型「Grok-1」及权重和网络架构。⭐OpenRouter�

Grok-1
零一万物发布 Yi 大模型 API 并启动公测：支持上下文 200K

零一万物发布了Yi大模型API，并启动了公测。这次邀测提供了两种模型:Yi-34B-Chat和Yi-34B-Chat-200K。Yi大模型API与OpenAIAPI完全兼容，可以平滑迁移，享受Yi大模型的超凡魅力。
四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

只要四行代码就能让大模型窗口长度暴增，最高可增加3倍!且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型就能摇身一变，成为LongLM。SE的原作者也说，目前SE方法的确还没有做过效率方面的优化，未来计划通过引入FlashAttention机制等策略来解决这一问题。

Mistral 大模型
荐一句话解锁100k+上下文大模型真实力，27分涨到98，GPT-4、Claude2.1适用

各家大模型纷纷卷起上下文窗口，Llama-1时标配还是2k，现在不超过100k的已经不好意思出门了。然鹅一项极限测试却发现，大部分人用法都不对，没发挥出AI应有的实力。月之暗面的工程师还搞了更多轮实验，其中一个居然是……坏了，我成测试数据了。

大模型

热文

3 天
7天

大模型长上下文窗口技术

与“大模型长上下文窗口技术”的相关热搜词：

相关“大模型长上下文窗口技术” 的资讯10篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

荐 1000万上下文！新开源多模态大模型，单个GPU就能运行

荐 AI说书媲美真人！豆包语音大模型升级长上下文理解

阿里云百炼上线Qwen2.5-Turbo模型：支持100万超长上下文

荐长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

Kimi首发“上下文缓存”技术，助推长文本大模型降本90%

谷歌硬刚GPT-4o，60秒视频生成模型虽迟但到，还把上下文窗口卷到了200万

荐今日AI：马斯克开源最大模型Grok-1；不等OpenAI！国产类Sora抢先开源；iPhone很快可直接使用Gemini模型；Kimi Chat超长上下文免费用

零一万物发布 Yi 大模型 API 并启动公测：支持上下文 200K

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

荐一句话解锁100k+上下文大模型真实力，27分涨到98，GPT-4、Claude2.1适用

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

《亮剑》开播20周年：今日全弹幕重返B站

蜜雪冰城上半年净赚27亿：全球门店破5.3万家加速全球化布局

小米澎湃OS 3超级岛适配应用公布加速推进多场景适配

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

曝苹果Vision Air头显2027年登场：售价腰斩重量更轻

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

抖音升级AI内容标识功能上线两项核心功能

小米汽车8月交付量超3万台全年交付量有望冲击42万

站长商机