性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

2025-06-23 08:49 · 稿源：快科技

快科技6月23日消息，据媒体报道，月之暗面（Moonshot AI）正式推出其首款Agent产品Kimi-Researcher（深度研究），并已启动小范围灰度测试。

该产品基于端到端自主强化学习（end-to-end agentic RL）技术打造，在HLE测试中表现优异，性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。

Kimi-Researcher 是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。与其他Agent不同，它采用零结构设计，无需复杂提示词或预设流程，完全依靠自主决策能力在动态环境中运行。

例如，它能自行判断信息冲突时的权衡策略、任务节点的切换时机，以及中间信息的取舍标准，其核心驱动力始终是任务的实际解决效果。

作为一款深度研究模型，Kimi-Researcher 整合了多源数据，并支持每条引用的直接追溯，确保研究严谨性，有效减少幻觉问题。月之暗面表示，未来将逐步开源Kimi-Researcher 的基础预训练模型及强化学习优化版本，以推动Agent强化学习领域的探索与发展。

（举报）

相关推荐

关键词：

荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

本期AI日报聚焦多项技术突破：OpenAI调整Sora免费额度并推出付费计划，标志视频生成进入商业化；Figma收购Weavy推出AI设计工具；OpenAI发布基于GPT-5的安全研究助手Aardvark；全球首款AI字体生成器Dr Fonts上线；中国信通院发布大模型一体机应用报告；月之暗面推出Kimi Linear架构实现推理速度6倍提升；Canva免费发布Affinity设计套件挑战Adobe；Chrome新增Gemini驱动的图像生成与深度搜索功能。

Sora OpenAI 视频生成
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
花生医疗携手NIHPLOD (旎柏) 强化孕产前中后期高端护理定制化服务

女性在备孕、孕期及产后因激素波动易出现皮肤问题，如出油、爆痘、敏感或妊娠斑。不当护理可能造成不可逆影响。花生医疗与高端护肤品牌NIHPLOD合作，针对孕期女性推出安全有效的定制护肤方案，结合医疗级月子照护与专业皮肤管理，通过个性化服务帮助准妈妈安心呵护肌肤，提升孕产期体验。未来双方将持续探索更多健康美学解决方案。

孕产护肤激素波动皮肤调理
行业唯一！海尔健康空气工程技术研究中心被中国轻工联评为“优秀”

在南京召开的轻工业科技创新大会上，海尔健康空气工程技术研究中心作为空调行业唯一入选单位，获评“优秀”等级。其凭借“水洗空气净化”技术升级至洗空气空调2.0，实现高效除尘除甲醛；通过声纹识别与大数据算法提供个性化服务，并首创Wi-Fi感控一体技术，实现主动送风与节能控制。这些创新技术经鉴定达国际领先水平，持续引领行业升级，将科技融入日常，为用户带来健康舒适体验。

家电产品升级健康空气调节科技创新
陈天桥在AIAS上首提“发现式智能”，宣告AI研究新范式

2025年10月27-28日，AI驱动科学研讨会（AIAS 2025）在美国旧金山举行。陈天桥发表主题演讲，首次提出“发现式智能”概念，指出这是真正的通用人工智能，强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径，并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群，支持年轻科学家探索智能本质。

AI驱动科学发现式智能通用人工智能
苹果回应输入法宁死不屈：具备记忆功能与学习机制

近日苹果自带输入法因体验问题再登热搜，用户集中吐槽其“宁死不屈”的倔强表现：输入部分词汇需反复手动选字，甚至被果粉自嘲“用iPhone后骂人从未赢过”。苹果客服回应称，默认输入法具备记忆功能，用户高频词汇会通过键盘词典实现首字母联想加载。该词典为互联网动态更新，但以常见内容为主，生僻词或诗词可能未被收录。同时补充说明键盘词典会基于用户习惯持续学习优化，初期体验可能不佳，但长期积累后流畅度将显著提升。

苹果输入法输入体验键盘词典
腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》，筑牢智能体应用安全基座

腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》，提出智能体场景罗盘评估模型，覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎，同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障，通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效，助力企业构建“高可靠、强防护”的智能体体系。

智能体落地腾讯云安全企业智能化转型
前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

11月12日，“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议，拥有丰富AI研发经历，先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示，将与团队致力于推动AI从语言迈向物理世界，全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

AI天才少女小米大模型罗福莉
YOUMAGIC舒立缇高能亮相CDA2025，引领皮肤医学前沿研究与创新

第二十届中国医师协会皮肤科医师年会暨全国美容皮肤科学大会在重庆召开。YOUMAGIC舒立绯通过科技展台、设备拆解展示及四场技术课堂，呈现其单极射频抗衰技术优势：100ms闪脉冲降低痛感，动态调节实现个性化治疗，临床验证显示3个月有效率100%。产品依托清华基因与医研融合，构建“更舒适、高效、安全”的技术体系，为行业提供精准抗衰新范式。

皮肤科医师年会美容皮肤科学大会技术创新
著名文化学者于丹确认出席全球创始人IP+AI万人高峰论坛

知名文化学者于丹教授将出席2025年11月22-25日在厦门举办的全球创始人IP+AI万人高峰论坛。作为国学传播者，她以通俗解读经典著作推动传统文化普及，作品销量超千万册。本次论坛以"IP+AI"为主题，于丹将分享传统智慧与现代科技融合的见解，为创业者、企业家提供人文视角的思考启发，促进科技与人文的深度对话。

今日大家都在搜的词：

热文

3 天
7天

性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

荐AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；Canva免费放出Affinity专业设计套件

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

花生医疗携手NIHPLOD (旎柏) 强化孕产前中后期高端护理定制化服务

行业唯一！海尔健康空气工程技术研究中心被中国轻工联评为“优秀”

陈天桥在AIAS上首提“发现式智能”，宣告AI研究新范式

苹果回应输入法宁死不屈：具备记忆功能与学习机制

腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》，筑牢智能体应用安全基座

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

YOUMAGIC舒立缇高能亮相CDA2025，引领皮肤医学前沿研究与创新

著名文化学者于丹确认出席全球创始人IP+AI万人高峰论坛

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

站长商机