强化学习

月之暗面（Moonshot AI）正式推出其首款Agent产品Kimi-Researcher（深度研究），并已启动小范围灰度测试。该产品基于端到端自主强化学习（end-to-end agentic RL）技术打造，在HLE测试中表现优异，性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。Kimi-Researcher 是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。与其他Agent不�...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“强化学习”的相关热搜词：

相关“强化学习” 的资讯13篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

月之暗面（Moonshot AI）正式推出其首款Agent产品Kimi-Researcher（深度研究），并已启动小范围灰度测试。该产品基于端到端自主强化学习（end-to-end agentic RL）技术打造，在HLE测试中表现优异，性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research，并与Gemini-Pro的Deep Research Agent持平。 Kimi-Researcher 是一款高度自主的智能研究助手，能够独立规划任务流程并交付完整结果。与其他Agent不�

月之暗面 Kimi-Researcher 智能研究助手
“人工智能强化学习可持续发展计划”发布，“教育普惠+标准共建”助力全球人工智能体系构建

6月11日，第二届"一带一路"科技交流大会人工智能赋能可持续发展论坛在成都举行。腾讯联合多家机构发起"人工智能强化学习可持续发展计划"，包含AI教育普惠和强化学习标准共建两大板块。该计划将面向全球高校开放《人工智能通识课》和《人工智能强化学习专业课》教学资源，助力构建高质量AI教学体系。同时，腾讯开悟人工智能全球公开赛颁奖典礼作为"学赛研产"联动的重要环节，吸引了19个国家和地区的近400所高校队伍参赛。2025年赛事将首次联合全国高校计算机能力挑战赛，围绕AI前沿产业真实场景设置赛题。腾讯还通过"青云计划"为全球顶尖AI人才提供就业机会，推动人才与产业高质量发展。北京大学等机构牵头制定了强化学习系统系列技术标准，填补了领域内标准空白。

一带一路人工智能可持续发展
荐 o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

关注NLP领域的人们，一定好奇「语言模型能做什么?」「什么是o1?」「为什么思维链有效?」在NeurIPS的LatentSpace非官方IndustryTrack上，Ai2研究科学家NathanLambert发表相关演讲，直接回答语言模型能否推理，以及o1和强化微调API给大家的启发。演讲内容亮点摘要:2025年，推理语言模型将取代后训练;强化学习训练不是后训练。他的谷歌总引用数为3459，但增长速度惊人:2024年比2023年翻了一番。

语言模型推理能力强化学习
荐 Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

【新智元导读】来了来了，月之暗面首个「满血版o1」来了!这是除OpenAI之外，首次有多模态模型在数学和代码能力上达到了满血版o1的水平。AI大神Karpathy曾说过，「英文是最热门的编程语言」。k1.5已经带来了诸多惊喜真是有点期待下一代模型的到来。

多模态模型编程语言 Kimi
荐 GPT-4o能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案

AI玩黑神话，第一个精英怪牯护院轻松拿捏啊。在本项研究中，数据集中的有效数据为1000条。

GPT-4o
荐刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

大语言模型还能向上突破，OpenAI再次证明了自己的实力。北京时间9月13日午夜，OpenAI正式公开一系列全新AI大模型，旨在专门解决难题。「除了新的o1系列模型，我们计划继续开发和发布我们的GPT系列模型。

大语言模型 OpenAI AI突破
首尔国立大学研究人员引入强化学习革新数字艺术拼贴

韩国首尔国立大学的研究人员致力于训练能够自主创作真正拼贴艺术品的AI代理人。目前市面上的AI工具可以生成类似拼贴的图像，但缺乏真正的创作过程的真实性。通过用户研究和客观评估的验证，这一突破为AI在艺术创作中开辟了新的道路，为机器在视觉艺术领域有意义地贡献创造了前景。

数字艺术拼贴强化学习
迪士尼玩起强化学习开发带有情感的新型机器人

迪士尼研究所在国际机器人大会上首次展示了一款可表达情感的新型四肢机器人。该机器人拥有一闪一闪的大眼睛、摇摇晃晃的脑袋和灵活摆动的触角，走路时屁颠屁颠但十分稳定。研究人员表示，这个情感机器人只是首个案例，通过模块化和通用的强化学习流程，可以快速教会不同外观、不同动作的机器人实现复杂的情感表达。

迪士尼
强化学习之父萨顿入局AGI创业放话不依赖大模型

传奇程序员卡马克和强化学习之父萨顿联手创办了AI创业公司KeenTechnologies，他们的目标是在2030年向公众展示通用人工智能的可行性。与主流方法不同，他们不依赖大模型是追求实时的在线学习。卡马克和萨顿的合作将引领AI领域的发展，为实现人工智能的全面进化提供新的思路和方向。

AGI
荐刺激，无人机竞速超越顶级人类玩家，强化学习再登Nature封面

在一场无人机比赛中，一架自主控制的无人机战胜了顶级人类玩家。这架自主控制无人机是由来自苏黎世大学的研究团队设计研发的Swift系统，研究成果登上了最新一期的《Nature》杂志封面。人类操控者规划运动的时间尺度较短，最多只能预测未来一个竞赛门。

无人机人工智能 Nature

热文

3 天
7天

强化学习

与“强化学习”的相关热搜词：

相关“强化学习” 的资讯13篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

性能超OpenAI、Gemini！月之暗面发布首个自主强化学习Agent

“人工智能强化学习可持续发展计划”发布，“教育普惠+标准共建”助力全球人工智能体系构建

荐 o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

荐 Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

荐 GPT-4o能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案

荐刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理极限

首尔国立大学研究人员引入强化学习革新数字艺术拼贴

迪士尼玩起强化学习开发带有情感的新型机器人

强化学习之父萨顿入局AGI创业放话不依赖大模型

荐刺激，无人机竞速超越顶级人类玩家，强化学习再登Nature封面

热文

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

王腾发文祝REDMI K90 Pro Max大卖王化回复“拥抱”表情

华为nova Flip S小折叠手机开启预售：3488元起

红魔11 Pro系列发布：4999元起首发风水双冷散热

苹果iPhone Air国行版今日预售：售价7999元起支持eSIM

OPPO Find X9预订量刷新Find系列历史最高纪录

微信员工回应好友互删后互动清除：并非新版本特性

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

京东回应下场造车：不直接涉及制造三方联合推出

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机