码农编码利器ChatCoder：通过与LLM聊天来细化需求

2023-11-16 14:22 · 稿源：站长之家

站长之家（ChinaZ.com）11月16日消息:大模型代码生成能力如何，还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4，到近来各种开源大模型，比如CodeLlama，有望成为码农编码利器。

然而，现实中，程序员们不会精炼表达需求，因此误导、限制了LLM生成优秀代码的能力。

为了解决大模型代码生成的需求表达问题，北大实验室的研究团队提出了通过与LLM聊天来细化需求的方法——ChatCoder。

论文地址:https://arxiv.org/pdf/2311.00272.pdf

ChatCoder通过聊天来辅助LLM和人类在需求细化方面的协作，从而提高大模型生成满足用户需求的代码。

ChatCoder的框架分为两个阶段:Paraphrase和Exend，以及Going-deep和Loop-back。在Paraphrase和Exend阶段，LLM根据用户的需求提示进行解释，并扩展假设。在Going-deep和Loop-back阶段，LLM向用户询问问题，解决需求细化中的困惑，并得到用户纠正后的规范。

经过两轮细化后，LLM生成满足用户需求的程序。

ChatCoder的评估结果显示，通过需求细化，ChatCoder帮助LLM提高了代码生成的执行精度。在Saniticed-MBPP上，ChatCoder带来了14%的性能提升。同时，ChatCoder的三种通信方法都对改进代码生成结果起到了作用。

人工干预在ChatCoder中扮演着重要的角色，因为需求细化需要揭示需求的内部结构和解决歧义。通过ChatCoder这种通过聊天进行需求细化的方法，可以提高大模型代码生成的能力，使其更好地满足用户需求。

（举报）

相关推荐

关键词：

CodeLlama

MCP服务库完整指南：如何选择最适合的Model Context Protocol服务

本文介绍了MCP（Model Context Protocol）作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展，选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值：提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务，初创公司可侧重简便性，大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展，并推荐使用专业对比平台（如mcp.aibase.cn）辅助决策。

MCP服务库 AI技术数据源连接
15天快装开业，Lamett乐迈石晶地墙品类投资模式解析

贝壳研究院数据显示，2025年中国存量房装修市场规模将达3.34万亿元，消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者，推出"100㎡开店、10余万投资、15天极速开业"轻资产模式，携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术，实现从地面材料向墙面、柜体等全屋空间应用的跨越，构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势，石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构，业务遍及80多个国家和地区，为高端住宅及商业空间提供整体解决方案。

存量房装修市场健康环保家装乐迈石晶招商
“无限量”供应Claude，就是AI IDE们的百亿补贴

Anthropic于2025年7月28日宣布，将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用，一次使用成本甚至高达数万美元，远远超过普通订阅预期。同样在上个月，Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制，导致大量用户抱怨“实际上并非无限”，纷纷在社群中吐槽，迫使公司CEO出面道歉、甚至给出退款补偿。这两�

文章搜索核心标签 AI工具
蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案，通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code，实现本地化部署。该方案具有三大优势：1）成本直降90%，免翻墙使用；2）支持128K超长上下文处理，编程能力超越主流模型；3）提供600万token免费额度。平台采用交互式界面设计，支持移动端操作和WebSocket通信，集成文件管理、Git工具和会话追踪功能，�

AI编程 Claude Code
CoinW 全栈融合，智能驱动——开启未来交易新格局

全球领先加密货币交易平台CoinW宣布全面升级，构建"交易无界"一体化生态。平台通过统一账户体系整合中心化与去中心化交易、底层公链基础设施及机构级服务，形成协同互通的全球数字资产生态系统。升级后的CoinW具备三大核心特性：1）智能策略执行系统自动优化交易路径；2）支持链上结算、MPC自托管及RWA等多元资产接入；3）模块化功能组合满足不同交易需求。平�

数字资产去中心化技术交易平台
Lamett乐迈石晶携手肖战共筑品牌势能，经销商信心倍增抢滩市场

欧洲高端建材品牌Lamett乐迈石晶宣布肖战成为首位全球品牌代言人，双方将共同推动"健康、安全"理念。Lamett创立于1985年，专注新型建材研发，2016年首创全球首款石晶地板，2024年又推出石晶柜板，实现从地面到全屋空间的应用突破。此次合作将助力品牌从专业领域走向大众视野，通过"全域营销+供应链布局+数字化管理"赋能经销商。目前品牌在中国设有七大直营体验中心，未来将通过"东西南北中"五大生产基地实现全链路自主把控。

肖战代言 Lamett乐迈石晶石晶全屋整装
荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

AI 游戏视频生成腾讯混元
Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

雷蛇宣布在新加坡设立全球AI卓越中心，并计划在欧洲和美国建立类似机构，推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师，专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件，包括Game Co-AI和QA Co-AI，帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期，预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示，此举将巩固该国作为区域AI创新中心的地位。

雷蛇人工智能游戏创新
GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

OpenAI正式发布GPT-5，与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出；Claude4Opus编程优异(72.5%)但数学较弱(33.9%)；Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面，GPT-5和Gemini2.5Pro定价相近($1.25-$10)，Claude4Opus较高($15-$75)。建议根据需求选择：GPT-5适合综合应用，Claude4Opus适合专业编程，Gemini2.5Pro适合长文档�

GPT-5发布大语言模型性能对比
AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构，激活参数32B，支持128K上下文，在代码调试和自动化流程方面表现突出；Qwen3-Coder为480B参数的MoE模型，原生支持256K上下文，擅长大规模代码库理解和API集成。二者在中级任务表现接近，但K2在复杂可视化任务更优，Qwen3在多轮Agent调用更稳定。建议根据需求选择：注重调试自动化选K2，需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

AI大模型选型编码能力对比性能评测

今日大家都在搜的词：

热文

3 天
7天

码农编码利器ChatCoder：通过与LLM聊天来细化需求

MCP服务库完整指南：如何选择最适合的Model Context Protocol服务

15天快装开业，Lamett乐迈石晶地墙品类投资模式解析

“无限量”供应Claude，就是AI IDE们的百亿补贴

蓝耘元生代MaaS × Kimi K2 × Claude CodeUI，开启编程效率革命

CoinW 全栈融合，智能驱动——开启未来交易新格局

Lamett乐迈石晶携手肖战共筑品牌势能，经销商信心倍增抢滩市场

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

Razer（雷蛇）在新加坡设立AI CENTER OF EXCELLENCE，加速人工智能投资布局

GPT-5和Claude 4 Opus谁更强？用这个AI大模型对比工具一眼明了

AI 大模型选型指导：一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

今日大家都在搜的词：

热文

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

华为MatePad Air 12英寸2025发布：售价2799元起

AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型M

REDMI Note 15 Pro系列官宣下周发布

华为MatePad 11.5 S 2025发布：预装鸿蒙5 首发售价2099元起

苹果正式入驻小红书 iPhone 17系列下月发布

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

iPhone17Pro最新外观曝光：苹果调整天线布局

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

全球首款女团机器人10580元拍出接入京东Joy Inside智能体

AI日报：智谱视觉推理模型GLM-4.5V开源；达摩院开源三项具身智

REDMI Note 15 Pro系列官宣本月发布

雷军发起小米YU7版本更名投票称小米YU7标准版绝非丐版

华为MatePad Air 12英寸2025发布：售价2799元起

华为MatePad 11.5 S官宣8月15日发布

周鸿祎与机器人PK球技：带球突破被机器人抢断

站长商机