首页 > 业界 > 关键词  > Claude最新资讯  > 正文

Anthropic 超越 OpenAI 的聊天机器人 Claude AI 能在一分钟内分析整本书

2023-05-15 11:21 · 稿源:站长之家

站长之家(ChinaZ.com) 5月15日消息:聊天机器人经常被忽视的一个限制是记忆能力。虽然这些系统的 AI 语言模型是基于 TB 级的文本上训练的,但它们在使用过程中能够处理的文本量(即输入文本和输出的组合,也称为「context window 上下文窗口」)是有限的。对于 ChatGPT 来说,大约是 3000 个单词。虽然有办法可以解决这个问题,但它仍然不是大量的信息。

大数据 人工智能 人脑 未来

现在,由前 OpenAI 工程师创立的人工智能初创公司 Anthropic 大大扩展了其聊天机器人 Claude 的上下文窗口,将其推至约 75,000 个单词。正如该公司在一篇博文中指出的,这足以一次性处理《了不起的盖茨比》这本小说的全部内容。事实上,该公司就是通过这样做来测试系统的——编辑小说中的一句话,并要求 Claude 发现变化。结果它在 22 秒内完成了此操作。

你可能已经注意到,在描述这些上下文窗口的长度时不够精确。这是因为 AI 语言模型不是以字符或单词的数量来衡量信息量,而是以「token」来衡量,这是一个不完全对应这些熟悉数量的语义单位。仔细想想,这是有道理的。毕竟,单词的长度可能长或短,并且它们的长度不一定与其意义的复杂性相对应(词典中最长的定义通常是给最短的词)。使用「token」反映了这个事实,因此,更精确地说:Claude 的上下文窗口现在可以处理 100,000 个 token,而之前只能处理 9,000 个 token。相比之下,OpenAI 的 GPT-4 可以处理大约 8,000 个 token(这不是 ChatGPT 中提供的标准模型——你需要付费才能使用),而 GPT-4 的完整模型可以处理多达 32,000 个 token。

目前,Claude 的新功能仅向 Anthropic 的商业合作伙伴提供,他们通过该公司的 API 接入聊天机器人。定价情况尚不清楚,但肯定会有相当大的增加。处理更多文本意味着在计算上需要花费更多。

但这个消息表明,AI 语言模型处理信息的能力正在增加,这无疑会使这些系统更加有用。正如 Anthropic 所指出的,一个人读完 75,000 个单词的文本大约需要五个小时,但通过 Claude 扩展的上下文窗口,它可以在几分钟内读取、总结和分析一篇长文档。(尽管这并不能解决聊天机器人常常编造信息的问题。)更大的上下文窗口还意味着系统能够进行更长时间的对话。导致聊天机器人失控的一个因素是,当它们的上下文窗口填满时,它们会忘记之前的对话内容,这也是为什么 Bing 的聊天机器人仅限于 20 个对话轮次。更多的上下文意味着更多的对话可能性。

这种扩展的上下文窗口对于许多应用场景都非常有用。在处理大量文本的任务中,聊天机器人可以更全面地理解和回应用户的问题。它们可以在更长的对话中保持上下文一致性,并提供更准确的回答和指导。例如,在客户服务中,聊天机器人可以更好地跟踪用户的问题和需求,从而提供更个性化和有针对性的支持。

尽管目前 Anthropic 的扩展上下文窗口功能只针对其商业合作伙伴开放,但随着时间的推移,这种技术可能会在更广泛的范围内得到应用。随着 AI 语言模型的进一步发展,处理更多信息的能力将会成为聊天机器人和其他自然语言处理系统的重要进步。

举报

  • 相关推荐
  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • Anthropic天价赔款?大模型“盗版”的100000种花样

    ​AI大模型的秘密配方是什么?答案可能很简单:海量的“盗版内容”。 这几乎是行业内公开的秘密。2023年,《纽约时报》一纸诉状将OpenAI和微软告上法庭,正式拉开了这场战争的序幕。很快,战火烧遍了整个硅谷。Meta因其Llama模型涉嫌使用盗版书籍而面临集体诉讼;Anthropic同样因其模型Claude的训练数据而被告,一时间,几乎所有头部玩家都被推上了被告席。 这场大模型与版权�

  • GPT-5正式发布:与Claude 4、Gemini 2.5等主流大模型谁更胜一筹?

    2025年8月7日,OpenAI正式发布GPT-5,官方称其为"最智能、最快速、最实用"的AI模型。GPT-5在数学推理能力上大幅提升,在AIME2025测试中取得94.6%的高分,处理速度也有明显改善。但与竞争对手相比仍存在差距:Claude4在代码生成和逻辑推理方面表现优异,支持200K token长文本;Gemini2.5具备2M超大上下文窗口和全模态支持;国产模型DeepSeek R1在中文理解和性价比方面具有优势。AI�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 蓝耘元生代MaaS × Kimi K2 × Claude CodeUI,开启编程效率革命

    蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案,通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code,实现本地化部署。该方案具有三大优势:1)成本直降90%,免翻墙使用;2)支持128K超长上下文处理,编程能力超越主流模型;3)提供600万token免费额度。平台采用交互式界面设计,支持移动端操作和WebSocket通信,集成文件管理、Git工具和会话追踪功能,�

  • GPT-4.5和Claude4哪家强?一文看懂优劣差异,附最实用AI大模型对比工具!

    文章对比分析了GPT-4.5和Claude4两大AI模型的性能差异:GPT-4.5在响应速度、编程能力和生态开放度上占优,适合实时对话和内容创作;Claude4则在长文本处理(200k+上下文)、安全性和企业适配性方面表现突出。推荐使用AIbase的模型对比工具(https://model.aibase.com/zh/compar)进行多维度智能筛选,根据具体场景(如客服、写作、编程等)选择最适合的模型。核心结论:没有绝对优劣,�

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

今日大家都在搜的词: