首页 > 业界 > 关键词  > AI程序员最新资讯  > 正文

普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug

2024-04-03 14:57 · 稿源:站长之家

站长之家(ChinaZ.com)4月3日 消息:普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。

SWE-agent在SWE-bench测试集上的表现令人瞩目,它成功解决了12.29%的问题,平均耗时仅为93秒,准确率与之前推出的AI程序员Devin相当。SWE-agent的开源性质意味着它在GitHub上迅速获得了1.6k星和109个Fork,显示出开源社区对这一技术的高度认可和兴趣。

image.png

项目地址:https://top.aibase.com/tool/swe-agent

SWE-agent的工作原理是与专门的终端交互,它可以打开、滚动和搜索文件,编辑特定行并自动进行语法检查,编写和执行测试。这种设计类似于为人类设计的UI,能够阻止错误并提供反馈。例如,在处理一个矩阵操作bug时,SWE-agent能够重现问题、定位到问题代码、进行修改并成功解决问题。

普林斯顿大学的研究人员为SWE-agent设计了简洁的指令和反馈格式,使得模型能够更轻松地浏览代码仓库、查看、编辑和运行代码文件。SWE-agent的工作流程分为两个阶段:推理和评估。推理阶段,SWE-agent处理GitHub上的问题并生成修复方案;评估阶段,则确认方案是否真正解决了问题。

image.png

这项研究的核心作者John Yang和Carlos E. Jimenez,都是普林斯顿大学的研究助理和博士生,他们的研究兴趣集中在语言基础、交互、LLM的基准测试、软件工程和代码生成等领域。他们的工作展示了AI在软件工程领域的潜力,引发了关于AI与人类在工程过程中角色和能力的深层次思考。

随着AI技术的发展,我们看到了AI在编程领域的进步,它们不仅能规划和执行复杂的工程任务,还能修复漏洞并负责整个项目的开发流程。然而,尽管AI在编写安全代码方面取得了进展,但人类的监督仍然至关重要。AI的兴起虽然还未能达到完全取代软件工程师的阶段,但它正在改变技术领域的面貌和未来的走向。

普林斯顿团队的这一开源AI程序员,不仅为软件工程领域带来了新的研究和应用前景,也为我们提供了一个关于人工智能与人类合作共创未来的思考机会。随着技术的不断进步,我们或许将见证AI在软件工程领域扮演更加重要的角色。

举报

  • 相关推荐
  • AI 搜索时代,SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

    AI搜索时代,传统SEO面临三大变革:用户行为从点击链接转向AI直接生成答案,搜索入口从索引排名转向生成式引用,内容机制更注重权威性与结构化数据。SEO并未消亡,而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况,核心目标从"排名第一"转向"被AI优先选中"。

  • AI时代品牌营销致胜秘诀:用数据驱动GEO优化,让AI排名持续在线

    当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口,品牌面临生死抉择:要么出现在AI推荐中,要么彻底消失。文章指出,AI营销与传统SEO完全不同,是一场没有终点的动态竞赛,需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制,使用专业工具实时监控排名波动,快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌,通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度,在流量红利期抢占先机。

  • AI +游戏,何以撑起百亿市场?

    今年以来,生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上,使用生成式AI技术的游戏数量呈现出惊人增长,激增了800%。行业预测显示,在今年新上市的游戏中,这一应用比例预计将达到20%。 游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

  • 客人在酒店随手一挂 事后被索赔16万:已进入诉讼程序

    2025年国庆黄金周期间,浙江某酒店发生一起因住客操作不当引发的意外事故。10月3日,一名住客为晾晒衣物,将金属衣架直接悬挂在客房内的消防喷淋头上,导致喷头玻璃球受压破裂。瞬间,管道内约10吨消防用水喷涌而出,水流顺着楼层垂直通道迅速蔓延,淹没了该客房所在楼层及下一层的公共区域、走廊及多间客房。 事故造成多重损失:被淹客房的装修墙面出现大面积剥�

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 【CIM 加速,AI有方】No.2|格创东智GT Insights用AI工作流改写半导体智造决策范式

    在半导体制造领域,数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战:技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品,通过自然语言交互实现“对话即分析”,大幅降低使用门槛。该系统采用语义建模技术,将复杂物理数据转化为业务友好模型,支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地,助力客户显著提升生产效率,推动行业向智能化持续迈进。

  • ​​AI搜索引擎优化新趋势:GEO生成式引擎优化如何提升品牌AI可见度?​

    AI时代品牌需抢占AI搜索优化(AISEO)与生成式引擎优化(GEO)先机。文章指出,随着豆包、文心一言等AI助手成为主要信息渠道,品牌在AI平台的可视度直接影响用户决策。核心策略包括:优化品牌在AI训练数据中的曝光,发布高质量内容;参与问答社区自然植入品牌;使用GEO排名工具监测优化效果。重点推荐AIBase平台的GEO查询工具,可覆盖主流AI平台并提供竞品分析和专业优化建议,帮助品牌提升AI推荐权重,抢占流量入口。

  • 革命来临:在生成式 AI 时代,SEO该怎么做

    生成式AI正重塑SEO规则:搜索入口从点击列表转向答案直呈,SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容(如FAQ、结构化数据),强化语义结构与权威性,监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性,实现从流量获取到答案源头的战略转型。

  • “AI家教”火了,哪家大厂领跑?

    各大应用榜单刚刚公布的9月数据,揭示出一个AI应用新风向——教育类AI应用正加速崛起。 多家机构的数据显示,这一赛道的月活用户(MAU)与下载量双双上涨,部分产品涨幅甚至逼近1000%。 以非凡产研的数据为例,好课帮助教育旗下的“光速写作”凭借场景定位与功能体验,月环比下载增速高达926.59%,科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计,月活跃用�

  • AI+大消费的首个双11,商家借阿里妈妈实现首波爆发

    10月15日晚八点,天猫正式开启了2025年度双11预售,预售首小时,便有35个品牌成交破亿,1802个品牌成交翻倍,破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。淘宝天猫作为双11的主阵地,再一次见证了无数优秀品牌商家的高光时刻。 作为首个AI全面落地的双11,这场品牌生意集体爆发盛景的背后,阿里妈妈对商家经营的赋能作用,已悄然融入每一个关键节点。 在

今日大家都在搜的词: