微软提出多任务处理模型TaskMatrix：一个AI驱动百万个AI和API

萧箫发自凹非寺量子位

通往AGI的路究竟怎么走，微软有了新想法——

基于ChatGPT这类大模型的强大理解能力，将输入的任何信号拆解成一个个可完成的任务，交给其他的AI和程序完成。

简单来说，就像是建了一座司令塔，每个大模型都能成为其中的“大脑”指挥官，其他专门解决某类任务的模型，则听它调令——

这样一来，不限定某个AI，所有大模型都能使用这套方法。

能解决什么问题？

人类只需要提需求，AI从自动做PPT、Word和Excel三件套（Office自动化），到驱动机器人完成各种智能任务，都能搞定。

这个最新的研究名叫TaskMatrix，据微软表示，它能直接驱动数百万个用于完成任务的AI和API。

论文还引用了OpenAI CEO奥特曼那句AI版摩尔定律：

宇宙中的智能数量每18个月翻一番。

一起来看看TaskMatrix是怎样工作的。

AI“司令塔”如何工作？

这是TaskMatrix的整体工作流程：

从架构图来看，TaskMatrix可以被分为四部分：

多模态对话基础模型（MCFM）：与用户对话并了解需求，从而生成API可执行代码以完成特定任务API平台：提供统一API格式，存储数百万个不同功能的API，允许扩展和删除APIAPI选择器：负责根据MCFM生成的内容推荐APIAPI执行器：调用API并执行生成代码，给出结果简单来说，MCFM负责生成解决方案，API选择器从API平台中选取API，随后API执行器基于MCFM生成的代码调用API，并解决任务。

其中，为了统一API管理，API平台又给API统一了文档格式，包含以下五个部分：

API名称（提供API摘要，避免与其他API混淆），参数列表（包含输入参数和返回值等），API描述（功能描述），组合指令（如何组合多个API完成复杂用户指令）

例如这是“打开本地文件”API的文档格式：