谷歌提出AGI完整路线图

谷歌DeepMind发布业内第一个AGI标准：AGI分级框架

08215559-2023-11-08T13:56:19.png

基本原则

谷歌认为，发展AGI必须遵循6个基本原则：
一、关注能力，而非过程。
这可以帮助我们去除一些不一定是实现AGI的必备要求：
比如AGI不一定要用类似人类的方式思考或理解，也不意味着系统必须具有主观意识等能力（主要是这种能力无法也通过固定的方法去测量）。

二、注重通用性和技能水平。
目前所有的AGI定义都强调了通用性，这一点不必多说。但谷歌强调，性能也是AGI的关键组成部分（也就是可以达到人类的几分水平）。在后面的具体阶段制定中，主要也是根据这俩指标进行分类的。

三、专注于认知和元认知任务。
前者目前基本为共识，即AGI可以执行各种非体力任务。不过谷歌在此强调，AI系统执行物理任务的能力也需要加强，因为它对于认知能力是有推动作用的。
此外，元认知能力，如学习新任务或知道何时向人类寻求帮助，是系统走向通用性的关键先决条件。

四、关注最高潜力，而非实际落地水平
证明一个系统可以在给定的标准上完成任务，就足以宣布该系统为AGI，我们不要求一定得在开放世界中完全部署出水平相同的系统。
因为，这可能会面临一些非技术阻碍，比如法律和社会考虑、潜在道德问题。

五、注重生态有效性。
所谓生态有效性，谷歌指的是选择真正有用的现实任务去benchmark系统的进步，这些任务不仅包括经济价值也包括社会和艺术价值，要避开那些容易自动匹配和量化的传统AI指标。

六、关注整条AGI之路的发展，而非单一的终点。

AGI之路的6个阶段由深度指标（即技能水平，与人类相比）和广度指标（通用性）进行划分。
第零阶段为“No AI”，计算软件、编译器等属于该范畴，在通用性上只能执行human-in-the-loop任务。

第一阶段为“涌现级”（Emerging），技能相当于或略比没有相关技能的人类要强。
ChatGPT、Bard和Llama 2等大模型就属于该阶段，并且已经满足了该阶段要达到的通用性。

第二阶段可理解为“刚刚合格级”（Competent），可以达到正常成年人50%的水平。
像语音助手Sir、能在短文写作/简单编码等任务中达到SOTA水平的大模型都属于这一阶段。不过，它们都只是在技能指标上合格了，通用性还够不上，也没有其它能够达到这一阶段通用性水平的AI产品。

第三阶段为“专家级”（Expert），可达到正常成年人90%的水平。
谷歌认为，拼写和语法检查器如Grammarly、图像生成模型Imagen等可以划为该阶段，主要也是在技能水平上达标了，通用性还不够。

第四阶段为“大师级”（Virtuoso），可达到正常人类99%的水平。
深蓝、AlphaGo等都属于。同样，还没有哪个AI产品可以达到属于这一级别的通用能力。

最后一阶段为“超人级”（Superhuman），在技能指标上，已经可以超越顶尖科学家的AlphaFold、AlphaZero也可划入该阶段。
毫无疑问，具备超人智能级通用性的AI还没诞生。

论文：https://arxiv.org/abs/2311.02462