首页 > AI头条  > 正文

AI编程工具Augment Code宣布支持GPT-5 引入模型选择器功能

2025-08-08 13:43 · 来源: AIbase基地

Augment公司宣布推出其最新的人工智能模型GPT-5,并首次引入了模型选择器功能,允许用户在Claude Sonnet4和GPT-5之间进行选择。这一创新举措标志着Augment在人工智能领域的重大进步,为用户提供了更多的灵活性和选择权。

在过去几周的内部测试中,Augment对两款模型进行了严格的对比测试,涉及单文件编辑、多文件重构、测试生成和大型代码库的错误修复等编码任务。测试结果显示,尽管Claude Sonnet4在速度上略胜一筹,更倾向于快速直接的响应,而GPT-5则在处理复杂任务时表现出更多的谨慎和彻底性,包括更详细的推理和在模糊情况下提出澄清问题。

微信截图_20250808133907.png

在偏好率上,GPT-5以约47%略高于Claude Sonnet4的约44%,但在平局率上两者均为4%。GPT-5在跨文件推理和依赖关系解析方面表现更强,而Claude Sonnet4在处理小型或中型变更时速度更快。在代码质量评论方面,Claude Sonnet4的评论更简洁,专注于主要变更,而GPT-5的评论更全面,包括边缘情况的覆盖。

Augment决定推出模型选择器的原因是为了给用户提供在彻底性和速度之间的选择权。一些用户可能更偏好精确性和边缘情况覆盖,而另一些用户可能更希望快速迭代。此外,如果某个模型提供商遇到延迟或质量波动,用户可以零成本切换模型,这为工作流程提供了额外的弹性。同时,用户的选择行为也为Augment提供了宝贵的反馈,有助于未来的模型优化和行为调整。

尽管Claude Sonnet4仍然是Augment的默认模型,但GPT-5为用户提供了另一种选择,特别是在需要不同方法处理任务时。Augment将继续监控用户在两种模型之间的使用分布、GPT-5采用激增的任务类型以及随时间变化的延迟趋势和失败模式。用户反馈对于塑造下一轮调整至关重要。

  • 相关推荐
  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 连涨5个月、全球TOP5,成都团队做的AI工具突破3000万访问量

    如今在全球AI竞赛中,中国厂商已从早期的跟跑者,转变为不可忽视的强力竞争者。 时间回到2023年,AI相关榜单都还被西方产品所霸占,仅过了一年这个格局就被打破,中国产品开始频繁出现在榜单中,并在多个细分领域跻身高位。 这点在AI生图赛道尤为明显。其中由成都厂商开发的SeaArt,最近一年流量增长很猛,先

  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • 一加Ace 6T支持IP66、IP68、IP69、IP69K满级防水

    一加Ace6T于11月20日发布,针对用户三大核心需求全面升级:支持IP66/68/69/69K四重防尘防水认证,覆盖日常泼溅到工业冲洗全场景;搭载超8000mAh硅碳负极电池与100W闪充,实现“充电5分钟,开黑3小时”;标配3D超声波指纹识别,湿手解锁成功率99%,解锁速度提升50%。该机通过32道工序与严苛测试,重新定义中端旗舰防护标准。

今日大家都在搜的词: