斯坦福AI小镇开源

今年4月，斯坦福和谷歌的研究者竟然构建出了一个虚拟小镇，让25个AI智能体在其中生存、从事复杂行为，简直堪称是《西部世界》走进现实。
11214636-2023-08-11T13:46:52.png
论文地址：https://arxiv.org/pdf/2304.03442.pdf

架构

为了生成智能体，研究者提出了一种全新架构，它扩展了大语言模型，能够使用自然语言存储Agent的经历。
随着时间的推移，这些记忆会被合成为更高级别的反射，智能体可以动态检索它们，来规划自己的行为。
最终，用户可以使用自然语言和全镇的25个Agent都实现交互。
11214910-2023-08-11T13:49:27.png
如上，生成式智能体的架构实现了一个「检索」功能。
这一功能将智能体的当前情况作为输入，并返回记忆流的一个子集传递给语言模型。
而检索功能有多种可能的实现方式，具体取决于智能体在决定如何行动时考虑的重要因素。
生成式智能体架构面临一个核心挑战，就是如何管理大量必须保留的事件和记忆。
为了解决这个问题，架构的核心是记忆流（memory stream），即一个记录智能体全部经验的数据库。
智能体可以从记忆流中检索相关记忆，这有助于它规划行动，做出正确反应，并且每次行动都会反馈记录到记忆流中，以便递归地改进未来行动。
另外，研究还引入了第二种类型的记忆——反思（reflection）。反思是智能体根据最近经历生成的高级抽象思考。
11214920-2023-08-11T13:49:36.png
在这项研究中，反思是周期性触发的过程，只有当智能体判断最近一系列事件的重要性评分，累积超过设定阈值时，才会启动反思机制。
生成式智能体为了创建合理的规划，它们会自上而下递归生成更多的细节。
而这些规划最初只是粗略的描述了当日所要做的事情。
11214939-2023-08-11T13:49:56.png
在执行规划的过程中，生成智能体会持续感知周围环境，并将感知到的观察结果存储到记忆流中。
通过利用观察结果作为提示，让语言模型决定智能体下一步行动：继续执行当前规划，还是做出其他反应。
在实验评估中，研究人员对这一框架进行了控制评估，以及端到端的评估。
控制评估是为了了解智能体能否独立产生可信个体行为。而端到端评估，是为了了解智能体的涌现能力以及稳定性。
比如，Isabella策划一个情人节party邀请大家来。12个智能体中，7个人还在考虑中（3个人有了别的计划，还有4个人没有想法）。
这一环节与人类相处模式很相似。
11215029-2023-08-11T13:50:46.png
像真人一样交互
11215049-2023-08-11T13:51:06.png
在这个名为Smallville的沙盒世界小镇中，区域会被标记。根节点描述整个世界，子节点描述区域（房屋、咖啡馆、商店），叶节点描述对象（桌子、书架）。
智能体会记住一个子图，这个子图反映了他们所看到的世界的各个部分。
研究者编写了一段自然语言，来描述每个智能体的身份，包括它们的职业、与其他智能体的关系，作为种子记忆。
比如，智能体John Lin的种子记忆就是这样的——

John Lin是一名药店店主，十分乐于助人，一直在寻找使客户更容易获得药物的方法。
John Lin的妻子Mei Lin是大学教授，儿子Eddy Lin正在学习音乐理论，他们住在一起，John Lin非常爱他的家人。
John Lin认识隔壁的老夫妇Sam Moore和Jennifer Moore几年了，John Lin觉得Sam Moore是一个善良的人。
John Lin和他的邻居山本百合子很熟。John Lin知道他的邻居TamaraTaylor和Carmen Ortiz，但从未见过他们。
John Lin和Tom Moreno是药店同事，也是朋友，喜欢一起讨论地方政治等等。

以下就是John Lin度过的一天早晨：6点醒来，开始刷牙、洗澡、吃早餐，在出门工作前，他会见一见自己的妻子Mei和儿子Eddy。
11215156-2023-08-11T13:52:12.png
就这样，当模拟开始时，每个智能体都有属于自己的种子记忆。
这些智能体相互之间会发生社会行为。当他们注意到彼此时，可能会进行对话。
随着时间推移，这些智能体会形成新的关系，并且会记住自己与其他智能体的互动。
一个有趣的故事是，在模拟开始时，一个智能体的初始化设定是自己需要组织一个情人节派对。
随后发生的一系列事情，都可能存在失败点，智能体可能不会继续坚持这个意图，或者会忘记告诉他人，甚至可能忘了出现。
幸运的是，在模拟中，情人节派对真实地发生了，许多智能体聚在了一起发生了有趣的互动。

地址：https://github.com/joonspk-research/generative_agents

架构

最新文章

分类

标签云

阅读排行榜

推荐排行榜

回复排行榜

最近回复

邮件订阅