2024年3月12日,Cognition AI公司认知实验室(Cognition Labs)推出了世界上首位全自主人工智能软件工程师——Devin

这看起来是Agent推理领域的一次巨大飞跃。他们声称,Devin 可以在几分钟内独立完成整个软件项目,能够进行复杂的多步骤推理,即使执行了数千项任务也不会出错。

Devin是一款类似于Copilot的软件开发助手,后者由GitHub、微软和OpenAI共同开发,但Devin的功能更为先进,不再局限于提供编程建议和自动完成部分任务,而是能够独立接手并完成整个软件项目

得益于长期推理和规划技术的提升,Devin具备策划并执行涉及数千个决策点的复杂工程任务的能力,且能在每一步骤中准确回忆相关上下文,随着时间推移不断学习并修正错误。同时,Devin配备了一整套开发工具,包括命令行界面、代码编辑器以及沙箱计算环境内的浏览器,使其拥有与人类工程师同等的工作条件

尤为引人注目的是,Devin能够实时报告工作进度、接受反馈,并根据需要与用户进行主动协作,共同探讨设计决策。其具体能力涵盖:

  • 学习新技术:通过阅读博客文章后,Devin能够在Modal平台上运行ControlNet生成定制的含有隐藏信息的图像

15143131-1.gif

  • 完成端到端应用构建与部署:Devin创建了一个模拟生命游戏的互动网站,能够根据用户需求逐步添加功能,并将其部署至Netlify平台

15143139-2.gif

  • 自主查找修复代码库中的bug:例如帮助维护调试开源编程书籍,或是直接从GitHub链接入手解决开源项目中的问题

15143149-3.gif

  • 自我训练和优化模型:仅凭一个指向GitHub研究仓库的链接,训练和微调自己的人工智能模型

15143159-4.gif

官网:https://www.cognition-labs.com/blog