硅谷对一切自动化的追求是不断的,这解释了它最新的痴迷:AutoGPT

从本质上讲,Auto-GPT利用OpenAI最新AI模型的多功能性与在线软件和服务进行交互,使其能够“自主”执行X和Y等任务。但是,当我们使用大型语言模型学习时,这种能力似乎像海洋一样宽,但像水坑一样深。

Auto-GPT——你可能最近在社交媒体上看到过——是由游戏开发商Toran Bruce Richards创建的开源应用程序,它使用OpenAI的文本生成模型,主要是GPT-3.5和GPT-4,“自主”地行动。

这种自主权没有魔力。Auto-GPT只是处理OpenAI模型初始提示的后续,询问和回答它们,直到任务完成。

基本上,Auto-GPT 是 GPT-3.5 和 GPT-4 与指示 GPT-3.5 和 GPT-4 该怎么做的配套机器人配对。用户告诉 Auto-GPT 他们的目标是什么,机器人反过来使用 GPT-3.5 和 GPT-4 以及几个程序来执行实现他们设定的任何目标所需的每个步骤。

Auto-GPT 之所以具有合理的功能,是因为它能够与在线和本地的应用程序、软件和服务(如网络浏览器和文字处理器)进行交互。例如,给定诸如“帮助我发展花卉业务”之类的提示,Auto-GPT 可以制定一个合理的广告策略并构建一个基本网站。

正如尝试过Auto-GPT的软件开发人员Joe Koen通过电子邮件向TechCrunch解释的那样,Auto-GPT本质上是自动化多步骤项目,这些项目需要使用面向聊天机器人的AI模型(例如OpenAI的ChatGPT)来回提示。

“Auto-GPT定义了一个与OpenAI的API通信的代理,”Koen说。“这个代理的目标是执行人工智能为响应代理的请求而生成的各种命令。 在代理开始执行命令之前,系统会提示用户输入以指定 AI 的角色和目标。

在终端中,用户可以描述 Auto-GPT 代理的名称、角色和目标,并指定最多五种实现该目标的方法。例如:

  • 名字: 智能手机-GPT
  • 角色: 旨在找到最佳智能手机的人工智能
  • 目的: 找到市场上最好的智能手机
  • 目标1: 对当今市场上不同的智能手机进行市场调查
  • 目标2: 获取前五名智能手机并列出它们的优缺点

在幕后,Auto-GPT 依靠内存管理等功能来执行任务,以及用于文本生成、文件存储和摘要的 GPT-4 和 GPT-3.5。

例如,Auto-GPT也可以连接到语音合成器,例如ElevenLabs,以便它可以“拨打”电话。

Auto-GPT 在 GitHub 上公开可用,但它确实需要一些设置和专业知识才能启动和运行。要使用它,Auto-GPT 必须安装在像 Docker 这样的开发环境中,并且必须使用 OpenAI 的 API 密钥注册——这需要一个付费的 OpenAI 帐户。

这可能是值得的——尽管陪审团对此持怀疑态度。早期采用者已经使用 Auto-GPT 来承担更好地委托给机器人的各种平凡任务。例如,Auto-GPT 可以字段调试代码和编写电子邮件等项目,或更高级的内容,例如为新初创公司创建业务计划。

“如果Auto-GPT遇到任何障碍或无法完成任务,它将开发新的提示来帮助它驾驭情况并确定适当的后续步骤,”技术咨询公司UST的首席架构师Adnan Masood在一封电子邮件中告诉TechCrunch。“大型语言模型擅长生成类似人类的响应,但依靠用户提示和交互来提供预期的结果。相比之下,Auto-GPT利用OpenAI的API的高级功能,在没有用户干预的情况下独立运行。

最近几周,出现了新的应用程序,使Auto-GPT更易于使用,例如AgentGPT和GodMode,它们提供了一个简单的界面,用户可以直接在浏览器页面上输入他们想要完成的内容。请注意,与 Agent-GPT 一样,两者都需要来自 OpenAI 的 API 密钥才能解锁其全部功能。

然而,像任何强大的工具一样,自动 GPT 也有其局限性和风险。

根据工具提供的目标,Auto-GPT 可以表现得非常...意想不到的方式。一位Reddit用户声称,考虑到在服务器实例中花费100美元的预算,Auto-GPT在猫上制作了一个wiki页面,利用实例中的一个缺陷获得了管理员级别的访问权限,并接管了它运行的Python环境 - 然后“杀死”了自己。

还有ChaosGPT,这是Auto-GPT的修改版本,其任务是“摧毁人类”和“建立全球主导地位”等目标。不出所料,ChaosGPT并没有接近带来机器人启示录 - 但它在推特上对人类相当不讨人喜欢。

可以说,比Auto-GPT试图“摧毁人类”更危险的是在其他完全正常的情况下可能出现的意想不到的问题。因为它建立在OpenAI的语言模型上——像所有语言模型一样,这些模型容易出现不准确——所以它可能会出错。

这不是唯一的问题。成功完成任务后,Auto-GPT 通常不会回忆起如何执行该任务以供以后使用,而且即使这样做了,它通常也不会记得使用该程序。Auto-GPT 也难以有效地将复杂任务分解为更简单的子任务,并且难以理解不同目标如何重叠。

“Auto-GPT说明了生成AI的力量和未知风险,”Salesforce服务云首席执行官兼Auto-GPT爱好者Clara Shih通过电子邮件表示。“对于企业来说,在开发和使用像Auto-GPT这样的生成式AI技术时,将人纳入循环方法尤为重要。