普林斯顿首个「开源」AI程序员进场基于GPT-4，可自动修复bug

2024-04-03 14:57 · 稿源：站长之家

站长之家（ChinaZ.com）4月3日消息:普林斯顿大学最近推出了一款名为SWE-agent的AI程序员，这是世界上首个开源的AI程序员，它基于GPT-4技术，能够在GitHub仓库中自动修复bug。这个智能体-计算机接口（ACI）的诞生，标志着AI在软件工程领域的应用迈出了重要一步。

SWE-agent在SWE-bench测试集上的表现令人瞩目，它成功解决了12.29%的问题，平均耗时仅为93秒，准确率与之前推出的AI程序员Devin相当。SWE-agent的开源性质意味着它在GitHub上迅速获得了1.6k星和109个Fork，显示出开源社区对这一技术的高度认可和兴趣。

项目地址:https://top.aibase.com/tool/swe-agent

SWE-agent的工作原理是与专门的终端交互，它可以打开、滚动和搜索文件，编辑特定行并自动进行语法检查，编写和执行测试。这种设计类似于为人类设计的UI，能够阻止错误并提供反馈。例如，在处理一个矩阵操作bug时，SWE-agent能够重现问题、定位到问题代码、进行修改并成功解决问题。

普林斯顿大学的研究人员为SWE-agent设计了简洁的指令和反馈格式，使得模型能够更轻松地浏览代码仓库、查看、编辑和运行代码文件。SWE-agent的工作流程分为两个阶段:推理和评估。推理阶段，SWE-agent处理GitHub上的问题并生成修复方案;评估阶段，则确认方案是否真正解决了问题。

这项研究的核心作者John Yang和Carlos E. Jimenez，都是普林斯顿大学的研究助理和博士生，他们的研究兴趣集中在语言基础、交互、LLM的基准测试、软件工程和代码生成等领域。他们的工作展示了AI在软件工程领域的潜力，引发了关于AI与人类在工程过程中角色和能力的深层次思考。

随着AI技术的发展，我们看到了AI在编程领域的进步，它们不仅能规划和执行复杂的工程任务，还能修复漏洞并负责整个项目的开发流程。然而，尽管AI在编写安全代码方面取得了进展，但人类的监督仍然至关重要。AI的兴起虽然还未能达到完全取代软件工程师的阶段，但它正在改变技术领域的面貌和未来的走向。

普林斯顿团队的这一开源AI程序员，不仅为软件工程领域带来了新的研究和应用前景，也为我们提供了一个关于人工智能与人类合作共创未来的思考机会。随着技术的不断进步，我们或许将见证AI在软件工程领域扮演更加重要的角色。

（举报）

相关推荐

关键词：

AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

AI搜索时代，传统SEO面临三大变革：用户行为从点击链接转向AI直接生成答案，搜索入口从索引排名转向生成式引用，内容机制更注重权威性与结构化数据。SEO并未消亡，而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况，核心目标从"排名第一"转向"被AI优先选中"。

AI搜索 SEO影响流量结构
AI时代品牌营销致胜秘诀：用数据驱动GEO优化，让AI排名持续在线

当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口，品牌面临生死抉择：要么出现在AI推荐中，要么彻底消失。文章指出，AI营销与传统SEO完全不同，是一场没有终点的动态竞赛，需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制，使用专业工具实时监控排名波动，快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌，通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度，在流量红利期抢占先机。
荐AI +游戏，何以撑起百亿市场？

今年以来，生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上，使用生成式AI技术的游戏数量呈现出惊人增长，激增了800%。行业预测显示，在今年新上市的游戏中，这一应用比例预计将达到20%。游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

生成式AI 游戏领域 Steam平台
客人在酒店随手一挂事后被索赔16万：已进入诉讼程序

2025年国庆黄金周期间，浙江某酒店发生一起因住客操作不当引发的意外事故。10月3日，一名住客为晾晒衣物，将金属衣架直接悬挂在客房内的消防喷淋头上，导致喷头玻璃球受压破裂。瞬间，管道内约10吨消防用水喷涌而出，水流顺着楼层垂直通道迅速蔓延，淹没了该客房所在楼层及下一层的公共区域、走廊及多间客房。事故造成多重损失:被淹客房的装修墙面出现大面积剥�

酒店事故消防喷淋住客操作
短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

在半导体制造领域，数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战：技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品，通过自然语言交互实现“对话即分析”，大幅降低使用门槛。该系统采用语义建模技术，将复杂物理数据转化为业务友好模型，支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地，助力客户显著提升生产效率，推动行业向智能化持续迈进。

半导体制造数据驱动精准决策
AI搜索引擎优化新趋势：GEO生成式引擎优化如何提升品牌AI可见度？

AI时代品牌需抢占AI搜索优化(AISEO)与生成式引擎优化(GEO)先机。文章指出，随着豆包、文心一言等AI助手成为主要信息渠道，品牌在AI平台的可视度直接影响用户决策。核心策略包括：优化品牌在AI训练数据中的曝光，发布高质量内容；参与问答社区自然植入品牌；使用GEO排名工具监测优化效果。重点推荐AIBase平台的GEO查询工具，可覆盖主流AI平台并提供竞品分析和专业优化建议，帮助品牌提升AI推荐权重，抢占流量入口。

AISEO GEO AI搜索引擎优化
革命来临：在生成式 AI 时代，SEO该怎么做

生成式AI正重塑SEO规则：搜索入口从点击列表转向答案直呈，SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容（如FAQ、结构化数据），强化语义结构与权威性，监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性，实现从流量获取到答案源头的战略转型。

生成式AI SEO变革搜索入口
“AI家教”火了，哪家大厂领跑？

各大应用榜单刚刚公布的9月数据，揭示出一个AI应用新风向——教育类AI应用正加速崛起。多家机构的数据显示，这一赛道的月活用户（MAU）与下载量双双上涨，部分产品涨幅甚至逼近1000%。以非凡产研的数据为例，好课帮助教育旗下的“光速写作”凭借场景定位与功能体验，月环比下载增速高达926.59%，科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计，月活跃用�

AI应用教育类AI 月活用户
AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

10月15日晚八点，天猫正式开启了2025年度双11预售，预售首小时，便有35个品牌成交破亿，1802个品牌成交翻倍，破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。淘宝天猫作为双11的主阵地，再一次见证了无数优秀品牌商家的高光时刻。作为首个AI全面落地的双11，这场品牌生意集体爆发盛景的背后，阿里妈妈对商家经营的赋能作用，已悄然融入每一个关键节点。在

双11预售天猫双11 阿里妈妈

今日大家都在搜的词：

热文

3 天
7天

普林斯顿首个「开源」AI程序员进场基于GPT-4，可自动修复bug

AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

AI时代品牌营销致胜秘诀：用数据驱动GEO优化，让AI排名持续在线

荐AI +游戏，何以撑起百亿市场？

客人在酒店随手一挂事后被索赔16万：已进入诉讼程序

短视频加速跑入AI时代

【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

AI搜索引擎优化新趋势：GEO生成式引擎优化如何提升品牌AI可见度？

革命来临：在生成式 AI 时代，SEO该怎么做

“AI家教”火了，哪家大厂领跑？

AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

火车免费坐？12306今起又上新功能：积分可兑换车票

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

真我GT8官宣搭载Pro同款理光GR影像系统

红米REDMI K90 Pro Max官宣搭载7560mAh电池

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为nova 14活力版、nova Flip S官宣明天发布

站长商机

普林斯顿首个「开源」AI程序员进场 基于GPT-4，可自动修复bug

今日大家都在搜的词：

热文

站长商机

普林斯顿首个「开源」AI程序员进场基于GPT-4，可自动修复bug