普林斯顿大学的研究团队近日推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4模型,能够在GitHub仓库中自主修复bug,平均用时仅需93秒,准确率与Devin相当。
09174654-2024-04-09T09:44:02.png
AI程序员SWE-agent的诞生,标志着软件工程领域的一个新突破。它不仅能够解决编程难题,还能够在真实的编程环境中快速修复bug,这对于提高软件开发的效率和质量具有重要意义。

SWE-agent的完全开源特性,使得它在GitHub上迅速获得了开发者社区的广泛关注和支持。在短短的十几个小时里,它就斩获了1.6k星和109个Fork,显示出开源社区对于这一创新项目的热烈反响。

SWE-agent的工作流程分为两个阶段:推理和评估。在推理阶段,SWE-agent处理GitHub上的问题,并生成修复问题的拉取请求。评估阶段则是确认拉取请求是否真正解决了问题。这一流程的实现,依赖于精心设计的智能体-计算机接口(ACI),使得LLM能够与Docker容器互动,实现代码的浏览、搜索、编辑和执行。

SWE-agent的技术亮点包括代码检查器、特制的文件查看器、全目录字符串搜索命令等。这些功能使得SWE-agent在处理代码时更加高效和准确。例如,文件查看器在每次只展示100行代码时效果最佳,而全目录搜索命令则简洁地列出含有匹配项的文件,避免了信息过载。

AI程序员如SWE-agent、Devin、Devika和OpenDevin的出现,不仅改变了软件工程的面貌,也引发了关于AI与人类合作共创未来的深入思考。尽管目前AI还无法完全取代人类软件工程师,但它们的出现无疑为技术领域带来了新的机遇和挑战。

参考资料