首页 > 业界 > 关键词  > CodeLlama最新资讯  > 正文

码农编码利器ChatCoder:通过与LLM聊天来细化需求

2023-11-16 14:22 · 稿源:站长之家

站长之家(ChinaZ.com)11月16日 消息:大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。

然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。

为了解决大模型代码生成的需求表达问题,北大实验室的研究团队提出了通过与LLM聊天来细化需求的方法——ChatCoder。

image.png

论文地址:https://arxiv.org/pdf/2311.00272.pdf

ChatCoder通过聊天来辅助LLM和人类在需求细化方面的协作,从而提高大模型生成满足用户需求的代码。

ChatCoder的框架分为两个阶段:Paraphrase和Exend,以及Going-deep和Loop-back。在Paraphrase和Exend阶段,LLM根据用户的需求提示进行解释,并扩展假设。在Going-deep和Loop-back阶段,LLM向用户询问问题,解决需求细化中的困惑,并得到用户纠正后的规范。

经过两轮细化后,LLM生成满足用户需求的程序。

ChatCoder的评估结果显示,通过需求细化,ChatCoder帮助LLM提高了代码生成的执行精度。在Saniticed-MBPP上,ChatCoder带来了14%的性能提升。同时,ChatCoder的三种通信方法都对改进代码生成结果起到了作用。

人工干预在ChatCoder中扮演着重要的角色,因为需求细化需要揭示需求的内部结构和解决歧义。通过ChatCoder这种通过聊天进行需求细化的方法,可以提高大模型代码生成的能力,使其更好地满足用户需求。

举报

  • 相关推荐
  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 蓝耘元生代MaaS × Kimi K2 × Claude CodeUI,开启编程效率革命

    蓝戟元生代MaaS平台推出"Kimi K2×Claude CodeUI"AI编程解决方案,通过国产首个万亿参数MoE架构开源模型Kimi K2驱动Claude Code,实现本地化部署。该方案具有三大优势:1)成本直降90%,免翻墙使用;2)支持128K超长上下文处理,编程能力超越主流模型;3)提供600万token免费额度。平台采用交互式界面设计,支持移动端操作和WebSocket通信,集成文件管理、Git工具和会话追踪功能,�

  • CoinW 全栈融合 ,智能驱动——开启未来交易新格局

    全球领先加密货币交易平台CoinW宣布全面升级,构建"交易无界"一体化生态。平台通过统一账户体系整合中心化与去中心化交易、底层公链基础设施及机构级服务,形成协同互通的全球数字资产生态系统。升级后的CoinW具备三大核心特性:1)智能策略执行系统自动优化交易路径;2)支持链上结算、MPC自托管及RWA等多元资产接入;3)模块化功能组合满足不同交易需求。平�

  • Lamett乐迈石晶携手肖战共筑品牌势能,经销商信心倍增抢滩市场

    欧洲高端建材品牌Lamett乐迈石晶宣布肖战成为首位全球品牌代言人,双方将共同推动"健康、安全"理念。Lamett创立于1985年,专注新型建材研发,2016年首创全球首款石晶地板,2024年又推出石晶柜板,实现从地面到全屋空间的应用突破。此次合作将助力品牌从专业领域走向大众视野,通过"全域营销+供应链布局+数字化管理"赋能经销商。目前品牌在中国设有七大直营体验中心,未来将通过"东西南北中"五大生产基地实现全链路自主把控。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • Razer(雷蛇)在新加坡设立AI CENTER OF EXCELLENCE,加速人工智能投资布局

    雷蛇宣布在新加坡设立全球AI卓越中心,并计划在欧洲和美国建立类似机构,推动游戏与开发者工具领域的创新。新加坡中心将招聘150名AI工程师,专注于下一代AI游戏技术研发。雷蛇还推出AI工具套件,包括Game Co-AI和QA Co-AI,帮助开发者提升游戏质量和开发效率。该战略布局正值全球游戏市场快速增长期,预计2033年AI游戏市场规模将达280亿美元。新加坡数字产业发展局表示,此举将巩固该国作为区域AI创新中心的地位。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

今日大家都在搜的词: