一口气读完一本三体，Moonshot AI首个大模型产品支持20万字上下文

2023-10-10 14:11 · 稿源：站长之家用户

2023 年 10 月 9 日，成立仅半年的大模型初创公司 —— Moonshot AI宣布在“长文本”领域实现了突破，推出了首个支持输入20万汉字的智能助手产品Kimi Chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度，标志着Moonshot AI在这一重要技术上取得了领先水平。

从技术上看，参数量决定了大模型支持多复杂的“计算”，而能够接收多少文本输入（即长文本技术）则决定了大模型有多大的“内存”，两者共同决定模型的应用效果。支持更长的上下文意味着大模型拥有更大的“内存”，从而使得大模型的应用更加深入和广泛：比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等，都可以在超长文本技术的加持下，成为我们工作和生活的一部分。

相比当前市面上以英文为基础训练的大模型服务，Kimi Chat具备较强的多语言能力。例如，Kimi Chat在中文上具备显著优势，实际使用效果能够支持约 20 万汉字的上下文，2.5倍于Anthropic公司的Claude-100k（实测约8万字），8倍于OpenAI公司的GPT-4-32k（实测约2.5万字）。同时，Kimi Chat通过创新的网络结构和工程优化，在千亿参数下实现了无损的长程注意力机制，不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。

目前，Moonshot AI 的智能助手产品Kimi Chat已开放了内测。

大模型输入长度受限带来的应用困境

当前大模型输入长度普遍较低的现状对其技术落地产生了极大制约，例如：

目前大火的虚拟角色场景中，由于长文本能力不足，虚拟角色会轻易忘记重要信息，例如在Character AI的社区中用户经常抱怨“因为角色在多轮对话后忘记了自己的身份，所以不得不重新开启新的对话”。

对于大模型开发者来说，输入prompt长度的限制约束了大模型应用的场景和能力的发挥，比如基于大模型开发剧本杀类游戏时，往往需要将数万字甚至超过十万字的剧情设定以及游戏规则作为prompt加入应用，如果模型输入长度不够，则只能削减规则和设定，从而无法达到预期游戏效果。

在另一个大模型应用的主要方向——Agent中，由于Agent运行需要自动进行多轮规划和决策，且每次行动都需要参考历史记忆信息才能完成，这会带来了模型输入的快速增加，同时也意味着不能处理更长上下文的模型将因为无法全面准确的基于历史信息进行新的规划和决策从而降低Agent运行成功的概率。

在使用大模型作为工作助理完成任务的过程中，几乎每个深度用户都遇到过输入长度超出限制的情况。尤其是律师、分析师、咨询师等职业的用户，由于常常需要分析处理较长的文本内容，使用大模型时受挫的情况发生频率极高。

而上述所有的问题在大模型拥有足够长的上下文输入后都将会迎刃而解。

长文本打开大模型应用的新世界

那么拥有超长上下文输入后的大模型会有怎样的表现？下面是一些Kimi Chat实际使用的例子：

公众号的长文直接交给Kimi Chat ，让它帮你快速总结分析

新鲜出炉的英伟达财报，交给Kimi Chat，快速完成关键信息分析：

出差发票太多？全部拖进Kimi Chat，快速整理成需要的信息：

发现了新的算法论文时，Kimi Chat能够直接帮你根据论文复现代码：

只需要一个网址，就可以在Kimi Chat中和自己喜欢的原神角色聊天：

输入整本《月亮与六便士》，让Kimi Chat和你一起阅读，帮助你更好的理解和运用书本中的知识：

通过上述例子，我们可以看到，当模型可以处理的上下文变得更长后，大模型的能力能够覆盖到更多使用场景，真正在人们的工作、生活、学习中发挥作用，而且由于可以直接基于全文理解进行问答和信息处理，大模型生成的“幻觉”问题也可以得到很大程度的解决。

不走捷径，解决算法和工程的双重挑战

长文本技术的开发，存在一些对效果损害很大的“捷径”，主要包含以下几个方面：

“金鱼”模型，特点是容易“健忘”。通过滑动窗口等方式主动抛弃上文，只保留对最新输入的注意力机制。模型无法对全文进行完整理解，无法处理跨文档的比较和长文本的综合理解（例如，无法从一篇 10 万字的用户访谈录音转写中提取最有价值的 10 个观点）。

“蜜蜂”模型，特点是只关注局部，忽略整体。通过对上下文的降采样或者RAG（检索增强的生成），只保留对部分输入的注意力机制。模型同样无法对全文进行完整理解（例如，无法从 50 个简历中对候选人的画像进行归纳和总结）。

“蝌蚪”模型，特点是模型能力尚未发育完整。通过减少参数量（例如减少到百亿参数）来提升上下文长度，这种方法会降低模型本身的能力，虽然能支持更长上下文，但是大量任务无法胜任。

简单的捷径无法达到理想的产品化效果。为了真正做出可用、好用的产品，就不能走虚假的捷径，而应直面挑战。

训练层面，想训练得到一个支持足够长上下文能力的模型，不可避免地要面对如下困难：

如何让模型能在几十万的上下文窗口中，准确的 Attend 到所需要的内容，不降低其原有的基础能力？已有的类似滑动窗口和长度外推等技术对模型性能的损害比较大，在很多场景下无法实现真正的上下文。

在千亿参数级别训练长上下文模型，带来了更高的算力需求和极严重的显存压力，传统的 3D 并行方案已经难以无法满足训练需求。

缺乏充足的高质量长序列数据，如何提供更多的有效数据给模型训练？

推理层面，在获得了支持超长上下文的模型后，如何让模型能服务众多用户，同样要面临艰巨挑战：

Transformer模型中自注意力机制（Self Attention）的计算量会随着上下文长度的增加呈平方级增长，比如上下文增加 32 倍时，计算量实际会增长 1000 倍，这意味着如果只是用朴素的方式实现，用户需要等待极其长的时间才能获得反馈。

超长上下文导致显存需求进一步增长：以 1750 亿参数的 GPT- 3 为例，目前最高单机配置( 80 GiB * 8 )最多只能支持 64k 上下文长度的推理，超长文本对显存的要求可见一斑。

极大的显存带宽压力：英伟达A800 或 H800 的显存带宽高达 2-3 TiB/s，但面对如此长的上下文，朴素方法的生成速度只能达到 2~5 tokens/s，使用的体验极其卡顿。

Moonshot AI的技术团队进行了极致的算法和工程优化，克服上述困难完成了大内存模型的产品化，发布了支持 20 万字输入的千亿参数LLM产品。

“登月计划”第一步：欢迎来到 Long LLM 时代

Moonshot AI创始人杨植麟此前在接受采访时曾表示，无论是文字、语音还是视频，对海量数据的无损压缩可以实现高程度的智能。

无损压缩的进展曾极度依赖「参数为王」模式，该模式下压缩比直接与参数量相关，这极大增加了模型的训练成本和应用门槛，而Moonshot AI认为：大模型的能力上限（即无损压缩比）是由单步能力和执行的步骤数共同决定的。单步能力与参数量正相关，而执行步骤数即上下文长度。

Moonshot AI相信，更长的上下文长度可以为大模型应用带来全新的篇章，促使大模型从 LLM时代进入Long LLM (LLLM)时代：

每个人都可以拥有一个具备终身记忆的虚拟伴侣，它可以在生命的长河中记住与你交互的所有细节，建立长期的情感连接。

每个人都可以拥有一个在工作环境与你共生（co-inhabit）的助手，它知晓公域（互联网）和私域（企业内部文档）的所有知识，并基于此帮助你完成OKR。

每个人都可以拥有一个无所不知的学习向导，不仅能够准确的给你提供知识，更能够引导你跨越学科间的壁垒，更加自由的探索与创新。

当然，更长的上下文长度只是Moonshot AI在下一代大模型技术上迈出的第一步。Moonshot AI计划凭借该领域的领先技术，加速大模型技术的创新和应用落地。

登月计划的伙伴说：

Monolith砺思资本专注于新一代数字产业和科技智造领域的投资，是Moonshot AI第一轮融资的 3 家投资机构之一，并一直以实际行动支持着公司发展。砺思资本创始合伙人曹曦表示，杨植麟是全球大模型领域里最被认可的华人技术专家，其团队在人工智能技术，特别是大语言模型LLM领域拥有深厚的技术积累，并已在国际上获得了广泛认可。眼下，美国硅谷的OpenAI和Anthropic等公司获得了多方关注，实际上在国内，拥有足够多技术储备的Moonshot AI也正成长为全球领先的AGI初创公司。多模态大模型是各家AI厂商竞争的关键领域，其中长文本输入技术更是其核心技术之一，Moonshot AI团队最新发布的大模型和Kimi Chat在这方面实现了重要突破，并已成功应用于多个实际场景。砺思将继续加码并支持Moonshot AI团队在AGI领域大胆创新和技术突破，引领中国人工智能技术的未来发展。

真格基金合伙人戴雨森对公司的发展表达了肯定和期许：“我们认为近期AI应用的爆火只是一场革命的序幕，AI技术要想真正改变世界创造巨大价值，在智能程度上还需要大的突破，这需要具备顶级技术能力的团队，以坚持追寻Moonshot的勇气，持续挑战智能提升的边界。杨植麟作为XLNet等多项知名科研工作的第一作者，具备非常丰富的科研和实践经验，多年来他一直坚信通过大模型实现对高维数据的压缩是人工智能发展的必经之路，也团结了一支人才密度超高，配合默契，又充满挑战巨头摇滚精神的创业团队。真格基金非常荣幸能够再次从天使轮开始支持杨植麟的新征程。”

关于 Moonshot AI

Moonshot AI 创立于 2023 年 3 月，致力于寻求将能源转化为智能的优解，通过产品与用户共创智能。创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发，多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。Moonshot AI 融资超 2 亿美元。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

499元起！iQOO WATCH GT 2发布：2.07英寸大屏、支持eSIM

iQOO WATCH GT 2于10月20日发布，起售价499元。配备2.07英寸超亮全景观屏，屏占比82.4%，峰值亮度2400尼特，视野显著提升。蓝牙模式下续航长达33天，较前代提升57%；eSIM模式支持18天续航。支持电竞模式2.0，可实时监测游戏心率，并显示心率浮动窗。具备100+运动模式识别、全天候健康监测及NFC卡包、无网通信等实用功能。提供三款配色，表身仅重33克。

iQOO WATCH GT
影视飓风最赚钱业务竟是电商一件T恤今年狂卖20万件

在B站UP主LKs的十年之约”系列播客首期节目中，影视飓风创始人Tim潘天鸿直面镜头，分享了公司运营的核心细节。其中，Tim意外披露影视飓风当前最赚钱的业务并非大众熟知的视频制作或内容创作，而是电商板块。他提到，仅一款T恤单品今年就已狂卖20万件。而此前最赚钱的业务是TVC广告，如今营收占比已经降到了10%左右。

影视飓风电商业务 B站UP主
金蝶征信“金融风控大模型” 摘得AFAC2025大奖

一家社区水果店凭借收款码的36个月交易记录，将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系：使用收款码满六个月的商户获贷可能性超60%，三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表，只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术，穿透至6层交易链条，构建包含4.45亿交易关系的产业互联网图谱，助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%，标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

社区水果店贷款额度收款码融资
荣耀亲选KUMI AI Note发布：支持AI通话录音智能转换 699元

荣耀发布KUMI AI Note智能记事本，售价699元。产品采用磁吸卡片设计，厚度仅2.89mm，重量30g，便于携带。具备五大AI功能：语音转逻辑图、133种语言翻译、断句排版、人物识别及信息整理，转写准确率98%。内置高品质电池，支持24小时连续录音，配备Wi-Fi快传技术（5小时录音30秒传完）。适合会议记录、内容创作等场景，是便携的AI办公助手。

荣耀Magic8系列 KUMI AI
Zen7 Labs 开源全球首个去中心化支付智能体（DePA），打造下一代AI Agent 金融基础设施

随着AI Agent经济崛起，支付成为制约智能体自主交易的关键瓶颈。Zen7Labs提出去中心化支付智能体DePA概念，并开源核心产品Zen7 Payment Agent。该方案具备原生多链兼容、免密授权、零托管安全等六大优势，通过四类Agent角色协同实现全流程自动化支付，有效融合传统跨境支付与加密支付优势。团队计划12个月内推出DePA Chain网络，构建低延迟、高安全的支付基础设施，为万亿美元级A

DePA 去中心化支付智能体经济
创新驱动芯耀未来——CPCA Show Plus 2025助力产业共享AI时代发展机遇

2025年电子半导体产业创新发展大会暨国际电子电路（大湾区）展览会（CPCA Show Plus）将于10月28-30日在深圳举办。展会以“创新驱动，芯耀未来”为主题，汇聚超300家展商，覆盖PCB制造全产业链，聚焦AI时代产业升级。活动将展示智能制造、绿色环保方案，举办多场技术论坛，推动产业链高效对接与协同发展，助力行业把握智能化、低碳化新机遇。

电子半导体创新发展国际展览会
两17岁男子往火锅里撒尿！海底捞小便事件220万判决已生效

备受关注的男子往海底捞锅底里撒尿”事件有了新进展。有媒体从最高人民法院获悉，上海市黄浦区人民法院判决唐某及其父母、吴某某及其父母分别在指定报刊上向海底捞赔礼道歉；双方父母赔偿海底捞餐具损耗费、清洗消毒费、经营损失、商誉损失等共计220万，目前该判决已生效。据上海市公安局黄浦分局通报，此事发生在今年2月24日凌晨。外省市来沪人员唐某（男�

海底捞事件火锅店纠纷未成年人违法
火山引擎：豆包大模型日均tokens使用量突破30万亿

今日在FORCE LINK AI创新巡展武汉站上，字节跳动旗下火山引擎披露最新大模型token调用数据。火山引擎总裁谭待现场表示，豆包大模型使用量从2024年5月1200亿tokens增长253倍至今年9月的超30万亿tokens。在企业市场，据IDC9月报告，2025年上半年，中国公有云大模型调用量达536.7万亿tokens。

火山引擎豆包大模型 token调用数据
AI防护，与时俱进：信通院X电子科大X腾讯云共话大模型安全

大模型技术推动人工智能成为生产力核心，但也放大数字风险。专家指出AI安全需构建覆盖模型安全、交互检测、权限管控的智能底座，通过标准化体系实现全生命周期防护。腾讯云等企业正通过网关架构、红队演练等方式提升安全能力，强调需政企学研协同构建开放生态，在创新中守住安全底线。

大模型技术智能体应用人工智能
AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

10月15日晚八点，天猫正式开启了2025年度双11预售，预售首小时，便有35个品牌成交破亿，1802个品牌成交翻倍，破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。淘宝天猫作为双11的主阵地，再一次见证了无数优秀品牌商家的高光时刻。作为首个AI全面落地的双11，这场品牌生意集体爆发盛景的背后，阿里妈妈对商家经营的赋能作用，已悄然融入每一个关键节点。在

双11预售天猫双11 阿里妈妈

今日大家都在搜的词：

热文

3 天
7天

一口气读完一本三体，Moonshot AI首个大模型产品支持20万字上下文

499元起！iQOO WATCH GT 2发布：2.07英寸大屏、支持eSIM

影视飓风最赚钱业务竟是电商一件T恤今年狂卖20万件

金蝶征信“金融风控大模型” 摘得AFAC2025大奖

荣耀亲选KUMI AI Note发布：支持AI通话录音智能转换 699元

Zen7 Labs 开源全球首个去中心化支付智能体（DePA），打造下一代AI Agent 金融基础设施

创新驱动芯耀未来——CPCA Show Plus 2025助力产业共享AI时代发展机遇

两17岁男子往火锅里撒尿！海底捞小便事件220万判决已生效

火山引擎：豆包大模型日均tokens使用量突破30万亿

AI防护，与时俱进：信通院X电子科大X腾讯云共话大模型安全

AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

火车免费坐？12306今起又上新功能：积分可兑换车票

红米REDMI K90 Pro Max官宣搭载7560mAh电池

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

站长商机