月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

2025-06-17 15:35 · 来源： AIbase基地

月之暗面（Moonshot AI）宣布推出其新开源模型 Kimi-Dev-72B，这一模型专注于软件工程任务，并在 AI 编程基准测试 SWE-bench Verified 中创下了全球最高的开源模型成绩。Kimi-Dev-72B 以仅72亿参数量的设计，成功超越了刚发布不久的 DeepSeek-R1，后者的参数量高达671亿。

在 SWE-bench Verified 测试中，Kimi-Dev-72B 获得了60.4% 的高分，成为当前开源模型中的新标杆。该模型的优化过程包括大规模强化学习，使其能够自动修复 Docker 环境中的真实存储库。Kimi-Dev-72B 在测试中仅在所有测试用例通过后才能获得奖励，从而确保所生成解决方案的正确性和稳健性，符合现实开发的高标准。

Kimi-Dev-72B 目前已在 Hugging Face 和 GitHub 平台上开放下载，用户可获取模型权重、源代码，技术报告也即将发布。Hugging Face 链接为:huggingface.co/moonshotai/Kimi-Dev-72B，GitHub 链接为:github.com/MoonshotAI/Kimi-Dev。

在设计理念方面，Kimi-Dev-72B 结合了 BugFixer 和 TestWriter 的双重角色。BugFixer 负责修复错误，TestWriter 则编写相应的单元测试。这两个部分相互补充，确保模型在编程任务中的有效性。Kimi-Dev-72B 的工作流程简单明确，主要分为文件本地化和代码编辑两个阶段。

为了增强模型的能力，月之暗面使用了约1500亿个高质量数据进行中期训练，数据来自 GitHub 的真实问题和 PR 提交。通过严格的数据净化，该模型能够学习人类开发者如何解决问题并编写代码。强化学习阶段则重点提升其代码编辑能力，通过基于结果的奖励系统，逐步优化模型的表现。

在测试环节，Kimi-Dev-72B 能够协调 BugFixer 和 TestWriter 的角色，采用自我博弈机制，从而提升模型的性能和效果。每个问题最多可以生成40个补丁候选和测试候选，显示了自博弈机制的强大效应。

未来，月之暗面计划进一步扩展 Kimi-Dev-72B 的功能，探索与流行开发工具的深度集成，使其更无缝地融入开发者的工作流程。公司承诺将持续改进这一模型，进行严谨的红队测试，以便向社区推出更强大的版本。

Hugging Face地址:huggingface.co/moonshotai/Kimi-Dev-72B

GitHub地址:github.com/MoonshotAI/Kimi-Dev

划重点:
🔍 Kimi-Dev-72B 是新发布的开源模型，创下了编程基准测试的全球最高分。
🚀 该模型结合了 BugFixer 和 TestWriter 的功能，以提升编程效率和代码质量。
💡 月之暗面将继续优化 Kimi-Dev-72B，未来计划与流行开发工具进行更深入的整合。

相关推荐

荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

本期AI日报重点报道了多项AI领域突破性进展：1.月之暗面推出万亿参数开源大模型Kimi K2，展现强大智能能力；2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统；3.通义千问发布桌面客户端Qwen Chat；4.IndexTTS2实现影视级语音合成；5.HuggingFace开源机器人Reachy Mini热销；6.Meta推出实时视频生成模型StreamDiT；7.PixVerse新增多关键帧视频生成功能；8.特斯拉推出仅支持AMD处理器的Grok AI助手；9.OpenAI推迟开源大模型发布以加强安全测试；10.Liquid AI开源边缘AI模型LFM2；11.AI"时间穿越"特效在社交媒体走红。

人工智能开源大模型技术趋势
荐AI日报：字节将发布AI编程工具TRAE2.0版本；Mistral重磅推出音频模型Voxtral；月之暗面回应Kimi K2 API速度慢

AI日报栏目聚焦AI领域最新动态：1)字节跳动将发布TRAE 2.0编程工具，新增语音交互功能；2)Mistral推出开源音频模型Voxtral，支持多语言；3)月之暗面回应Kimi K2API速度慢问题，正在优化系统；4)昆仑万维发布AgentOrchestra框架，实现多智能体协作；5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资；6)Kimi-2上线，性能超越GPT-4.1；7)TRAE推出Kimi-K2模型服务，国际版支持Grok-4；8)字节跳动Seed�

人工智能编程工具字节跳动
荐K2发布后，Kimi 研究员集体在X和知乎上搞起了“团建”

Kimi K2的发布几乎没什么预兆。 2025年7月11日深夜，月之暗面直接开源了这个万亿参数模型，整个AI圈子一下子就热闹起来。模型的能力很强，尤其是在代码和Agent任务上，没多久，它就和Grok4一起出现在了马斯克转发的热门模型趋势榜单上。

AI模型发布 Kimi K2
荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

【AI日报】汇总了近期AI领域重要进展：1)月之暗面推出Kimi Playground平台，实现从对话助手到智能助理的转变；2)OpenAI发布ChatGPT Agent，支持自主执行浏览、购物等任务；3)Suno发布v4.5+版本，新增人声替换等音乐创作功能；4)谷歌Veo3视频生成模型上线，支持文本转视频；5)全球首个直播流扩散模型MirageLSD发布，实现实时视频转换；6)VSCode编程助手Traycer提升大型代码库处理效率；7)ART框架支持Python一键训练AI Agent；8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低；9)Mistral AI推出Le Chat挑战ChatGPT；10)百度小度上线首个支持物理交互的MCP Server；11)Lightricks的LTXV模型实现60秒高质量视频生成；12)开源模型LTX-Video13B支持30倍速高清视频生成。
荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

【AI日报】今日AI领域重要动态：1)美图推出RoboNeo，通过自然语言指令实现图片精修、品牌设计等全能影像处理；2)Unsloth AI将Kimi K2模型量化至1.8bit，体积缩减78%保持性能；3)谷歌Gemini嵌入模型登顶MTEB榜单，超越OpenAI；4)亚马逊发布免费AI代码编辑器Kiro，集成Claude模型；5)Claude新增应用工具目录功能提升工作效率；6)MiniMax完成近3亿美元融资，估值超40亿美元；7)UTCP新协议让AI代理直
最强Agent？3分钟看懂Kimi K2真的好用吗？

Moonshot AI于2025年7月11日发布开源大模型Kimi K2，主打代码编写、数学推理和Agent工具调用功能。该模型采用MoE架构（1T参数，激活32B），在SWE-Bench等测试中表现优异，数学推理得分达97.4。支持128k上下文、工具调用和API集成，定价为输入4元/百万tokens、输出16元/百万tokens。相比闭源模型，Kimi K2具有开源免费、成本低等优势，适合开发者和企业使用。同时推荐AIbase平台，可系统比较�
荐AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海累计82款大模型通过备案

AI日报栏目聚焦人工智能领域最新动态：1)xAI发布旗舰模型Grok4，在数学推理和代码生成表现突出，同时推出开发者专用Grok4Code；2)微软开源Phi-4-mini模型，推理效率提升10倍，适合边缘设备；3)上海82款大模型完成备案，垂直领域应用取得突破；4)Hugging Face推出开源桌面机器人Reachy Mini，支持Python编程；5)Perplexity发布AI浏览器Comet挑战Chrome；6)OpenAI将首次发布开放权重模型，打破闭源惯例；7)谷歌医疗AI模型MedGemma系列上新，单个GPU即可运行；8)OpenAI以约65亿美元收购AI硬件公司io Products，正式进军硬件市场。
当 CODING 宣布其 DevOps 产品停服计划时，国内软件研发工具行业的平静被彻底打破

腾讯旗下CODING DevOps平台将于2024年9月起逐步停服，极狐GitLab迅速推出专属迁移福利争夺用户。其优惠政策包括：首年订阅超低折扣（SaaS团队版300元/人）、免费代码仓库迁移服务、社区版用户专属折扣及3个月企业版试用权益。此举直击用户迁移痛点，降低经济门槛和操作风险。极狐凭借"中外合作3.0"模式在中国市场快速崛起，已与沃尔玛、理想汽车等企业建立成功合作案例。这场用户争夺战将加速国内研发工具行业洗牌，推动平台提升智能化服务和生态建设，最终使开发者获得更高效的工具选择。
72岁老人坐石头10秒屁股竟烫糊了需进行植皮手术

近日，湖北襄阳发生了一起因高温导致的意外烫伤事件，一名 72 岁的王奶奶在自家菜园劳作时，因坐在暴晒后的石头上休息仅 10 余秒，便不幸遭遇三度烫伤，需进行植皮手术。这一事件再次为公众敲响了高温天气下物表烫伤的警钟。事发当日正午，气温高达38℃，王奶奶在劳作间隙感到疲惫，便选择坐在一块石头上短暂休息。然而，这块被烈日暴晒的石头表面温度极高，�
荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

AI日报栏目精选了人工智能领域最新动态：1)Stability AI推出0.7秒单图3D重建模型SPAR3D；2)GitHub热门开源AI协作框架CrewAI获3.4万星；3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议；4)ComfyUI-C opilot工具简化AI工作流创建；5)CNNIC报告显示我国346款生成式AI完成备案；6)提示词管理工具AI Gist上线；7)开源语言学习工具WordPecker支持多语言学习；8)斯坦福推出多工具协作AI Agent OctoTools；9)Ope

今日大家都在搜的词：

热文

3 天
7天

月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

荐AI日报：字节将发布AI编程工具TRAE2.0版本；Mistral重磅推出音频模型Voxtral；月之暗面回应Kimi K2 API速度慢

荐K2发布后，Kimi 研究员集体在X和知乎上搞起了“团建”

荐A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布ChatGPT Agent；Suno推人声替换功能

荐AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型上线；亚马逊推AI代码编辑器 Kiro

最强Agent？3分钟看懂Kimi K2真的好用吗？

荐AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海累计82款大模型通过备案

当 CODING 宣布其 DevOps 产品停服计划时，国内软件研发工具行业的平静被彻底打破

72岁老人坐石头10秒屁股竟烫糊了需进行植皮手术

荐A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉”数字人平台启动封测；京东重磅开源JoyAgent-JDGenie

今日大家都在搜的词：

热文

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

黄仁勋：总感觉公司快倒闭了任CEO没有趣味每一秒都有压力

A日报：Stability AI发布实时重建模型SPAR3D；火山引擎“奇美拉

华为Pura 80标准版7月23日开启预售

苹果iOS 26公测版本周发布：预计7月23日亮相

特斯拉Model3全球销量达300万辆夏日福利大放送

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

华为鸿蒙智行：尊界S800上市50天大定破8000台

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

华为MatePad Pro 12.2开启预约预计7月24日正式发布

小米深圳大厦开园：卢伟冰现场喝小米粥

理想i8开启预定：7月29日上市预售价35-40万元

小米骨传导耳机2发布：699元 7月21日开售

华为 MatePad Pro 12.2 英寸 2025 官宣 7 月 24 日发布

站长商机

​月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录

今日大家都在搜的词：

热文

站长商机

月之暗面发布全新开源模型 Kimi-Dev-72B，打破编程基准记录