首页 > 业界 > 关键词  > 月之暗面最新资讯  > 正文

性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent

2025-06-23 08:49 · 稿源: 快科技

快科技6月23日消息,据媒体报道,月之暗面(Moonshot AI)正式推出其首款Agent产品Kimi-Researcher(深度研究),并已启动小范围灰度测试。

该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不同,它采用零结构设计,无需复杂提示词或预设流程,完全依靠自主决策能力在动态环境中运行。

例如,它能自行判断信息冲突时的权衡策略、任务节点的切换时机,以及中间信息的取舍标准,其核心驱动力始终是任务的实际解决效果。

作为一款深度研究模型,Kimi-Researcher 整合了多源数据,并支持每条引用的直接追溯,确保研究严谨性,有效减少幻觉问题。月之暗面表示,未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本,以推动Agent强化学习领域的探索与发展。

举报

  • 相关推荐
  • 月之暗面通用型本地Agent Kimi Work宣布内测

    月之暗面在6月3日宣布,一款名为Kimi Work的通用型本地Agent正式开启内测。该产品随Kimi最新的测试版Mac和Windows客户端一同推出,主要面向知识工作者群体。 Kimi Work的底层由一套称为Kimi Code的内核驱动,负责提供本地Agent所需的基础能力,包括安装和使用各类技能、执行定时任务等。在此基础上,Kimi Work继承了在线版Kimi Agent已经具备的专业技能,例如建站和PPT制作,同时接入了

  • AI日报:快手App上线AI购物助手;Kimi Work开启内测;微信互联多厂商推A2A助手

    本期AI日报聚焦多项创新:快手App上线AI购物助手,提升导购效率;月之暗面推出本地Agent工具Kimi Work,助力知识工作者;微信与多家手机厂商合作A2A助手,提升操作效率;豆包计划推出付费专业版,提供六大垂直服务;亚马逊App新增AI生成图片功能,深化视觉搜索;中兴通讯与腾讯达成战略合作,AI云电脑搭载原生Work Buddy;谷歌AI Edge Gallery登陆Mac,支持本地离线运行大模型;红魔游戏平板5 Pro搭载185Hz高刷屏,集成豆包大模型。

  • 月之暗面宣布Kimi Work内测:知识工作者的通用型本地Agent来了

    月之暗面宣布Kimi Work开启内测,这是一款面向知识工作者的通用型本地Agent,随Kimi最新测试版客户端推出。其核心是Kimi Code,支持安装技能、运行定时任务等基础能力,并继承了在线版Agent的建站、PPT等专业Skills及金融、科研等数据库,内置Kimi WebBridge方案。Kimi Work支持Agent集群,可自主创建最多300个子Agent团队,用户只需用自然语言描述目标,即可自动拆解任务、并行执行、调用工具等,最终交付文档、表格等工作产物,覆盖办公、研究等多种场景,使AI从对话助手走向工作执行者。

  • 世界杯开赛首日 华为FreeArc足球款正式开售:599元

    今天凌晨,美加墨世界杯正式开幕,揭幕战已经结束,墨西哥2:0胜南非。 在世界杯开赛首日,华为FreeArc足球款也将于10:08分正式开售,定价599元。 华为FreeArc是华为首款开放式耳挂耳机,与FreeClip的日常时尚定位不同,FreeArc主要专注于运动场景。 耳挂部分选用0.7mm高性能镍钛记忆合金,兼具灵活性与韧性,能根据不同用户的耳型进行自适应调节。 S形贴耳曲线设计和重心天�

  • AI日报:高德问店上线AI能力开放调用;大众点评严打AI灌水评论;Kimi将发行AI原生信用卡

    本日AI日报聚焦八大热点:高德地图推出“高德问店”AI开放生态,为中小商户提供智能经营能力;万象有声上线全自动AI多播有声书创作系统,万字成本不到8元;大众点评严打AI灌水,升级AIGC评价治理;月之暗面Kimi拟与银行合作发行融合算力的AI原生信用卡;苹果iOS27健康应用新增智能营养识别与围绝经期追踪;IDC报告显示中国智能体开发平台市场达17.5亿元,蚂蚁数科位列第�

  • AI日报:Kimi Code开源编码代理升级;苹果正面回应 iOS 27 AI 争议;蚂蚁打通全球智能体支付新链路

    苹果回应iOS 27 AI争议,强调Apple Foundation Models纯自研;Kimi Code开源编码代理升级,支持CLI一键安装和视频上下文;蚂蚁集团发布AMP协议,打造全球智能体支付新链路;谷歌AI Plus降价并提升存储空间;微软开源项目遭黑客入侵,多款AI工具被植入密码窃取软件;滴滴首批接入微信AI生态;阿里成立Token Foundry事业部加速AI战略;美团重组AI一级部门,加速大模型渗透本地生活。

  • 用AI猜胜负!Kimi官宣将公开预测104场世界杯赛事:德国队或爆冷夺冠

    2026年美加墨世界杯即将揭幕。 据了解,这届扩军至48支球队的历史性赛事,将在小组赛、32强、16强、四分之一决赛、半决赛和决赛的完整赛程中,带来总计104场对决。 昨日,Kimi宣布将公开预测2026美加墨世界杯104场赛事。 据介绍,Kimi将通过Agent集群”同时调度300个子Agent,从战术、球员、伤病、赛程、历史、舆情、天气、心理、赔率变动、专家观点等维度,并行研究104场世

  • 小米MiMo Code发布并开源:界面全汉化!自进化终端AI编程助手

    小米正式发布并开源终端AI编程助手MiMo Code V0.1.0,基于OpenCode二次开发,采用MIT协议,个人和企业可自由使用修改。内置免费多模态模型MiMo-V2.5,性能对标Claude Sonnet 4.6,兼容主流大模型和第三方Token服务。独创持久记忆系统解决长会话信息丢失,Harness系统实现全流程自动化编程,实测在SWE-Bench等测试集得分高于Claude Code 5个百分点。支持语音输入、跨平台(Mac/Linux/Windows),界面全中文汉化,安装简洁。

  • 京东发布国内首个智能体自主支付协议 破解AI自主付款难题

    京东推出国内首个面向AI智能体的自主支付协议A2P,将AI支付分为L0至L5六个等级,从完全人工确认到AI自主操作。重点聚焦L3和L4:L3允许智能体在单一任务内自主发起支付,系统在用户设定边界内裁决;L4则给予更多授权,在预设范围内可自主完成支付。该协议配备专属身份核验机制,资金隔离处理,每笔支付留下完整记录,形成可追溯的凭证链条,补齐了AI消费的安全短板。

  • 技嘉推出融合动漫美学与 AI 性能强化 B850 雕妹主板

    技嘉科技推出全新B850 AORUS ELITE-P ICE雕妹主板,回应全球动漫爱好者和PC DIY社群的成长需求。这款ATX版主板融合二次元角色元素,提供黑白双色选择,并搭载X3D Turbo Mode(一键提升AMD Ryzen 9000系列X3D处理器游戏性能达18%)、AI强化D5 Bionic Corsa技术及EZ-DIY创新设计(如M.2 EZ-Flex散热、EZ-Latch Plus快拆等),兼顾性能与个性化。该主板将在COMPUTEX期间于技嘉展位(#M0520)亮相。

今日大家都在搜的词: