首页 > AI头条  > 正文

月之暗面Kimi推出Kimi-Researcher深度研究Agent 并开启内测

2025-06-21 09:44 · 来源: AIbase基地

近日,月之暗面旗下的Kimi智能助手宣布其首个Agent产品——Kimi-Researcher(深度研究)正式开启小范围灰度测试。这一基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,旨在为用户提供高效、深入的深度研究服务。

Kimi-Researcher在面对问题时,展现出强大的自主规划与执行能力。它不仅能够主动澄清问题、深入思考,还能自主规划关键词进行搜索,并筛选出高质量的信息。在处理任务时,Kimi-Researcher平均会进行23步推理,规划74个关键词,并找到206个网址,最终只保留信息质量最高的前3.2%内容。这一过程确保了研究成果的详实与可溯源性。

微信截图_20250621094225.png

除了强大的信息搜索与筛选能力外,Kimi-Researcher还能自主调用浏览器、代码等工具,处理原始数据并自动生成分析结论。其交付成果包括一份信息详实、可溯源的深度研究报告,以及一个可交互、可分享的动态可视化报告。这些报告不仅长度在万字以上,平均引用约26个高质量信源,还支持在线生成链接并分享,极大地方便了用户的展示与协作需求。

为了验证Kimi-Researcher的真实能力,月之暗面为其安排了一场高难度的“考试”——Humanity’s Last Exam(HLE)。这套专为AI设计的高难度benchmark覆盖了上百个专业领域,从数学、物理、医学到政治、历史,全面考察模型在复杂知识任务中的解决能力。Kimi-Researcher在完全零结构、无流程设计的设置下,取得了Pass@1准确率26.9%、Pass@4准确率40.17%的优异成绩,超越了多个知名AI模型,达到了目前已知的最高水平之一。

在真实场景的应用中,Kimi-Researcher同样展现出了出色的表现。无论是算法同学寻找高价值的benchmark、运营同学研究行业内的公司发展,还是法务朋友快速了解各国数据隐私法规,Kimi-Researcher都能在短时间内生成结构清晰、信息全面的报告,为用户提供有力的支持。

月之暗面表示,Kimi-Researcher是通过端到端强化学习训练出来的Agent模型,具有零结构、自适应的特点。它没有复杂的提示词或预设流程,而是完全依靠模型自身的试错与学习来应对复杂任务。这种设计使得Kimi-Researcher在面对信息冲突、工具切换和环境变化时,能够展现出强大的适应性与泛化能力。

目前,Kimi-Researcher正处于小范围灰度测试阶段。用户可以通过访问kimi.com申请内测资格,并在获得权限后打开Kimi对话框下方的“深度研究”按钮开始使用。

  • 相关推荐
  • 小米将多枚商标转让至Kimi 后者为月之暗面旗下AI助手

    近日有信息显示,小米科技有限责任公司将多枚“kimi”商标转让至北京月之暗面科技有限公司。据了解,这些商标最早申请于2013年,目前多数商标状态为已注册。 北京月之暗面科技有限公司成立于2023年4月,法定代表人是杨植麟,注册资本达100万人民币。

  • 如何用 Kimi AI 创作儿童歌词?

    本文介绍如何利用Kimi AI创作儿童歌词。用户只需在Kimi平台注册登录后,明确创作主题(如"小兔子"等),输入包含歌词风格、内容要求的提示词,AI即可快速生成富有童趣的歌词初稿。用户可对生成内容进行调整优化,如简化副歌、修改韵律等,使歌词更符合儿童理解和演唱需求。该工具适用于亲子互动、儿童教育等场景,能帮助家长轻松创作专属儿歌。

  • 如何用Kimi打造销售员朋友圈良好人设?

    本文介绍如何利用AI工具Kimi打造职场优质形象。通过每周固定内容输出:周一分享行业报告展现专业深度,周三发布团队合照突出协作精神,周五转发公司新闻彰显产品自信。操作流程包括注册登录、输入特定指令生成文案、优化调整后发布。这种系统化的朋友圈运营能逐步建立"优质打工人"人设,提升个人品牌影响力。Kimi工具可快速生成符合职场形象的文案内容,帮助销售人员高效塑造专业形象。

  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • Agent成了腾讯AI最大的牌面

    抓住DeepSeek带来的契机扭转AI领域的竞争态势之后,腾讯围绕AI应用的布局正在快速深化。 元宝、ima等原生AI应用是腾讯进行探索的最前线。腾讯元宝通过大规模市场投入获得用户增长后,继续拓展了更多能力,包括将元宝放入微信好友列表,打通与腾讯地图、腾讯文档的连接,以及上线Chrome浏览器插件。腾讯管理层目前还在观察用户对这些新增功能的反馈,判断哪些功能可以�

  • 如何用AI Agent让企业效率翻倍?

    2025年5月,红杉资本AI峰会在旧金山落下帷幕。这场汇聚150位全球顶尖AI公司创始人的大会达成重要共识:下一轮AI竞争的核心不再是工具本身,而是为用户创造的实际收益。在此背景下,Agent的重要性被前所未有的推至所有人的视野前沿。 硅谷大厂开启了第一波加速,微软CEO纳德拉在主题演讲中宣布:“我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问�

  • 容联云语音坐席代理:懂业务的Agent,让金融对话更有温度与效率

    容联云推出"大型语音坐席代理"解决方案,通过AI技术革新传统金融客服交互模式。该方案具备五大核心能力:1)智能理解客户意图,准确率达95%;2)强降噪处理嘈杂环境通话;3)拟人化语音交互,支持情绪适配;4)自动生成通话总结与商机洞察;5)人机无缝协作,支持多任务监控。应用场景覆盖客户服务(7*24小时响应)、精准营销(降低30%挂断率)和人性化催收(

  • 发布AI Agent开发平台,做强AI生态… 网易数智接下来这么干

    AI时代正从AIGC转向AI Agent发展。微软CEO纳德拉预测AI Agent将成为新应用,Gartner预计到2028年超1/3企业软件将集成AI Agent功能。网易数智发布CoreAgent智能体开发平台及多款行业智能体,助力企业快速落地AI应用。文章指出当前AI Agent面临技术门槛高、场景适配难等挑战,网易提出"技术共生、市场共拓、利润共享"的生态协同理念,强调AI需要与行业know-how结合才能创造真实价值。网易数智宣布品牌升级,从"科技蓝"变为"网易红",展现拥抱AI时代的决心。

今日大家都在搜的词: