我们距离AGI还有多远？6个认知框架，看懂智能体、智能自动化与自主工作的级别分类

发布时间：2024-12-16 09:10

情绪智商与自我认知的结合：提升情绪自我认知有助于提升整体情绪智商 #生活技巧# #情绪调节技巧# #情绪自我认知#

原创王吉伟王吉伟

我们距离AGI还有多远？智能体、智能体自动化的5个级别与自主工作的6个level

从智能体、智能自动化与自主工作的级别分类，看我们距离AGI还有多远

智能体分级框架盘点：AI Agent、智能体自动化与自主工作的6个认知框架

智能体的5个等级是什么？智能体自动化和自主工作都有哪些级别？一文看懂

距离AGI还有多远？6个认知框架，看懂智能体、智能自动化与自主工作的级别分类

全文约6200字，阅读时间10分钟

文/王吉伟

5月底，一篇名为《Levels of AI Agents: from Rules to Large Language Models》的论文在学术圈和技术广为传播。

论文地址：https://arxiv.org/pdf/2405.06643

该论文受美国汽车工程师学会（SAE）提出的自动驾驶六个级别启发，在系统探讨了智能体（AI agents）不同发展阶段的同时，基于效用和强度将个人大语言模型Agent分为5个级别：

L1-简单步骤跟随：Agent通过遵循用户或开发人员预定义的精确步骤来完成任务。

L2-确定性任务自动化：基于用户对确定性任务的描述，AI Agent在预定义的操作空间中自动完动化成步骤。

L3-战略任务自动化：根据用户指定的任务，AI Agent使用各种资源和工具自主规划执行步骤，并根据中间反馈迭代计划直到完成。

L4-记忆和上下文：Agent感知用户上下文，理解用户记忆，有时主动提供个性化服务。

L5-数字角色：Agent代表用户完成事务，代表用户与他人进行交互，保证安全可靠。

具体内容见下图，这里贴上论文截图和机翻版，方便大家理解。

根据体验及应用过的智能体，你认为现在的Agent已经到了哪个级别？欢迎文末留言。

随着大语言模型与AI Agent技术的快速发展，人们对于AGI的探索热情也越发激烈。这篇论文除了提出AI Agent的五级量化，还尝试性地提出了AGI的级别。

等级0：无AI；

等级1：初现，等同于或略优于无技能的人类；

等级2：新兴，至少达到熟练成人的50百分位；

等级3：专家，至少达到熟练成人的90百分位；

等级4：大师级，至少达到熟练成人的99百分位；

等级5：超人，超越100%的人类。

这里，同样贴上中英文截图。

这个框架，从性能和通用性对AGI水平进行划分。其中通用性又分为狭义和一般两个维度，并通过一些AI产品对比说明。

性能估计了人工通用智能（AGI）在特定任务上与人类水平表现的比较。泛化能力衡量了人工智能达到目标性能阈值的任务范围。性能和/或泛化水平之间的进展速率可能是非线性的。

通过此框架，可以看到我们目前处于广义上的一级AGI，狭义上的5级超人。话说AlphaFold及AlphaZero到达这个级别了吗？大怎么看？

PS：本文提到的论文以及相关图片，后台发消息分级获取。

OpenAI的AGI五级量化表

这篇论文发布2月后的7月份，OpenAI发布了其根据自身技术研发与产品开发的通往AGI的五级量表。OpenAI 将 AI 开发分为五个阶段，每个阶段代表更高级的能力水平：

第 1 级：聊天机器人 — 具有对话语言技能的AI；

第 2 级：推理者 — 能够在人类层面解决问题的AI；

第 3 级：Agents — 可以代表用户执行操作的AI；

第 4 级：创新者 — 可以协助发明的AI；

第 5 级：组织者 — 可以管理组织任务的AI

彼时OpenAI刚发布o1模型不久，并且正在筹建多智能体团队，因此处于第二阶段与第三阶段之间。现在的OpenAI已经开源了多智能体框架Swarm，当然它仍然处于2.5这个level。后续的进展，还要看明年初将要发布的能够操作PC的智能体。

目前OpenAI向多Agent系统迈进与第三阶段的目标一致，其中 AI Agent应代表用户执行操作，从而提高他们的能力和效率。

这里，也贴上这个五级量化表的中文版。

可以看到，OpenAI定义的第五级是能够帮助组织完成复杂业务流程的AI。按照现在AI的发展速度，GUI-Agent将能够快速接管一定的企业流程自动化，加上RAG技术的快速迭代翻新，5年之后差不多能够实现。但实现这个目标，却不一定能够实现AGI的目标。毕竟LLM是存在一定的技术缺陷的，这也是抱有“AI泡沫论”看法之人的主要论据之一。

有人把OpenAI的五级量表看作通往AGI之路，也有人并不这么认为。比如在近日的一次采访中，微软人工智能首席穆斯塔法・苏曼（Mustafa Suleyman）与 OpenAI 首席执行官山姆・阿尔特曼 Sam Altman)之间就人工通用智能(AGI)的实现时间产生了明显分歧。尽管 AGI 的实现是 “有可能的”，但这一目标可能需要十年的时间才能达到。

当然，还要看大语言模型的发展进程，毕竟LLM Based Agent的重点在于LLM。

目前OpenAI的12天直播已经进行了1/3，还没有关于AI Agent的内容，或许奥特曼会把智能体技术或者产品作为压轴场也说不准，我们期待其在智能体方面更多的动作。

AI Agent的5个级别详尽版

在继续这一部分之前，我们先搞清楚一些概念。

从去年AutoGPT爆发到现在，出现了越来越多与AI Agent相关的术语。事实上，AI Agents、Autonomous Agents、Agentic Application、 Agentic X、人工智能代理等短语都是可以互换使用的术语。

其中，Autonomous Agents（自主智能体）是能够独立执行一系列复杂任务以实现目标的AI系统。它是AI Agent发展的终极目标，各种类型的智能体都将奔着这个目标而努力。而现在我们常说的Agent其实也是泛指自主智能体，确切的说是自主智能体发展的初期阶段。

有了上述论文和OpenAI的五级量化表，关于AI Agent的五级量化的方法便逐渐被人们接受。随着人们的进一步探索，更加详细的AI Agents 5级量化呼之欲出。

下面这张图来自于 Kore.ai首席宣传官COBUS GREYLING，完整而详细的描绘了不同级别的AI Agent的技术、性能、能力、关键特征和用例。

通过具体技术描述的五级AI Agent，如下：

L5：基于LLM的AI+工具(意图+行动+推理与+记忆+反思+自主学习+泛化+人格(情感+性格)+协作行为(多AI Agent)

L4：基于LLM的Al+工具(意图+行动+技艺精湛者相理与决策+记忆与反思+自主学习泛化)

L3：基于LLM的AI+工具(意图+行动+推理与决策+记忆与反思

L2：基于IL/RL的AI+ 工具(意图 +)动作+推理 &决策

L1：基于规则的AI+ 工具(意图+行动)

L0：没有人工智能工具(意图+规则+操作)

需要说明的是，这张图表也是一个矩阵图。X轴（性能）从下到上展示随着智能体级别的增长性能逐步提升，Y轴（一般性）从左到右展示了不同级别智能体的各项属性。

这张图最具价值的地方在于，它不仅展示出了智能体的技术路径，还通过特征与案例让大家更容易理解各级智能体，并用具象化数字表述出了它们的能力，对于企业应用智能体和技术企业开发智能体都有一定的指导作用。

从这张图表来看，目前市面上以及大家在用的AI Agent主要为第三级，且正在向第四级发展。

我们也能看到，整张图片描绘了一个非常有“钱景”的AI Agent未来画卷。COBUS GREYLING根据上面提到到论文编辑制作了这张图片，且对AI Agent的看法也别具一格。

AI Agent应用程序利用一个或多个语言模型作为其核心基础或主干，动态生成响应和操作。

这些应用程序管理状态和转换，同时实时构建事件链以解决特定的用户查询，从而提供自适应解决方案。

AI Agent擅长处理模棱两可或隐含的问题，将它们分解为连续的子步骤，并通过行动、观察和反思的循环迭代处理，直到达到最终解决方案。

延迟和成本管理对于对话式实施至关重要，可以平衡响应能力与资源效率。Agentic 实现的延迟可能是个问题。

可检查性和可观察性对于生产实施至关重要，开发了强大的机制来揭示AI Agent所经过的状态和路径，从而确保透明度。

为了完成任务，AI Agent可以使用各种工具，每个工具都有明确的目的——无论是进行 API 调用、执行计算还是搜索 Web。

人机协同（HITL）可以用作辅助工具，使AI Agent能够在需要时寻求人工输入，从而扩展其操作能力。

可以无缝集成新的AI Agent工具以扩展功能，从而允许持续适应和增强自主AI Agent功能。

AI Agent拥有真正的自主权，独立做出决策和执行行动，需要最少的人工监督。自主性级别由 AI Agent 可以循环的迭代次数设置，以得出结论;以及可供使用的工具数量。

凭借先进的灵活性，AI Agent可以根据情境需求动态选择和排序工具，采用推理和自适应策略来解决出现的复杂任务。

不得不说，这些分享都是不错的点，有助于大家开阔智能体行业视野。

智能体自动化的五个级别

在五级AI Agent的基础上，自动化领域开始探索智能体自动化（Agentic Automation，也称作代理自动化）。比如Semae.ai联合创始人Antti Karjalainen，提出了智能体自动化的五个级别。

Antti在其文章中说，随着Agents成为当下的AI流行语，一切都变成了Agent。很有意思的一句话，虽然流行语更多时候颇具娱乐性，但确实能看出各个领域对于Agent的态度。大家都在谈的东西，想不火都难，不是吗？

而一旦Agent成为元宇宙一样的流行词汇，也意味着更多人并不了真正解它。所以为了消除这些噪音并帮助更多公司设定他们的目标，Semae.ai引入了一种根据AI Agent功能和结果对AI Agent进行分类的方法。

没错，这也是一个智能体分类方法，不过角度换到了自动化。如下：

下面，是对于每一级智能体自动化的具体解读。

0 级：固定自动化

在基层，固定自动化不代表真正的Agent行为。它相当于传统的机器人流程自动化（RPA），具有一组固定的规则和完全确定的结果。没有计划或执行控制，因为一切都是在编程过程中预先确定的。人工交互仅限于处理异常，并且任务范围仅限于基于规则的逻辑。

示例：表单、网站和业务应用程序的数据输入。数据收集和抓取。

第 1 级：AI 增强自动化

首先，第一级在个人决策层面介绍基本的Agent行为。它本质上是固定的自动化，其中一些步骤由大型语言模型（LLM）增强。虽然与传统自动化相比，它提供的好处有限，但它代表了通过约束决策迈向更高级Agent的第一步。

示例：对客户支持电子邮件进行分类并将其转发给合适的团队。

第 2 级：Agent助理

随着我们上升一个级别，我们看到能够使用工具调用的特定任务Agent自动化助理。这些系统可以解释用户意图，确定所需的结果，并采取适当的行动——例如总结文本、生成内容或使用特定工具。但是，它们仅限于静态的短期计划。

示例：用于搜索、汇总和起草电子邮件的对话式 co-pilot。

第 3 级：计划和反思

今天，这个级别通常被称为 AI Agent，它是第一个表现出受限自主性的级别。这些Agent系统可以根据给定的意图创建计划，执行它们，反思它们的成功，并在必要时在执行过程中修改计划。当今许多高级 AI Agent都在此级别运行，能够进行多个推理循环和规划以实现预期结果。

示例：根据一组人工级别的规则和准则，根据内部系统对账一张100页的发票。处理流程流和数据中的复杂性、模糊性和可变性。

第4 级：自我完善

4 级Agent自动化将能够在有或没有人工协作的情况下进行有意义的自我提升。它可以检查和修改其指令和学习数据，创建新工具，并连接到新的数据源。这种级别的自动化使Agent能够跟上不断变化的任务和环境。虽然目前是理论上的，但我们知道 4 级系统是可能的。然而，今天的 AI 模型缺乏在实际业务应用程序中支持它们的推理能力。

示例：复杂发票对账的Agent，可以通过最少的人工协调添加新供应商，并随着时间的推移提高准确性。

第 5 级：自主性

最高级别的Agent自动化代表了许多人认为的通用人工智能（AGI）。这些假设的Agent表现出原创思维，并将综合解决以前看不见的任务。利用先进的逻辑推理和创造力，5 级特工将能够解决初始训练之外的复杂问题。

示例：数字知识工作者能够在没有监督的情况下端到端处理复杂任务。

对于分类和了解智能体自动化和AI Agent的功能，这个框架提供了一种有用的方法。通过明确定义这些级别，可以更好地沟通AI系统，设定切合实际的期望，并规划智能体自动化开发的前进道路。

需要注意的是，目前我们主要在前三个级别内运营。超出此水平代表未来的可能性，这些可能性将改善我们的工作方式。随着技术迭代和应用发展，按照作者的意思，这个框架应该也会会不断发展以适应 AI 功能的新突破和见解。

从自动化角度来看市场的话，目前更多企业尚处于L0-L1，从L0、L1到L3，是广大技术供应商的机会。

自主工作的六个层次

AI Agent不只影响了企业数字化技术的应用，更影响了广大组织的业务架构与作业方式。Agent的终极发展目标是Autonomous Agent能够实现主动响应和自主运行，所以在Agentic AI影响下的工作最终也将发展成为自主工作（autonomous work）。

未来十年不断改进的AI资源将对企业和人类劳动力产生双重影响。AI将产生广泛的增强效应，接管低价值的任务，并使人类能够将精力集中在更具战略性和创造性的工作上。

在这个不完整但仍然相对坚实的基础上，受到汽车工程师协会创建的“驾驶自动化的6个级别”的启发（PS：驶自动化已经启发了很多行业），Salesforce首席数字宣传官Vala Afshar等人开发了一个认知框架-自主工作的六个层次，用于反映AI 能力的演变以及它们将如何在未来十年左右对公司产生影响。

下面是对这个框架各维度的简单解释。

级别（Level）

每个自动化工作级别都由数字（0-6）和标题标识。标题指的是AI在该级别可以完成的工作量和复杂性。它本质上是一个通用的工作分解，从最小和最简单的工作单元开始，即一个任务（1级）。

比任务高一级的是子流程（2级），指的是通常按顺序执行以完成业务流程的一个离散部分的一组任务，例如确保所有相关信息已准确无误地收集完整以开启客户案例。

在3级，AI有能力完成一个业务流程，如接收客户订单、从开放到关闭管理客户案例，以及筛选潜在客户。

在4级，AI可以完成从开始到结束的几个流程，执行通常按角色分配的大部分工作，如销售代表、营销专家或服务Agent。我们在这里关注的是典型的商业运营，但在制造业和其他类型的运营中也同样适用。

阶段（Phase）

六个自动化工作级别并不代表AI的线性发展轨迹。AI不会以传统的职业晋升方式在组织中发展到更高级别的角色。相反，在其发展过程中将有两个非常不同的阶段。

第一个是1-3级，我们可以将其描述为增强阶段，在这个阶段数字助手将使人类员工能够发挥最大的工作能力，并为他们创造新的机会。

第二个是4-6级，这是替代阶段，在这个阶段数字Agent将从人类那里承担越来越多的责任，并随着时间的推移开始取代他们。

AI角色（Al Role）

在这里，我们从非技术的角度描述了AI的主要能力以及它与人类同事的关系。如果有兴趣，我们将在后续提供每个级别的更深入的技术视角，但现在我们希望突出人与AI之间的关系。

人类角色（Human Role）

这是AI角色的另一面，同样关注人类与AI之间的关系以及他们的相对责任和能力。

采纳（Adoption）

预计主流采纳者（广泛包括早期和晚期大多数采纳者类别）开始在每个级别应用AI的日期。创新者和早期采纳者会更早，而落后者可能会更晚，除非危机改变了他们的发展轨迹。

采纳率将因行业而异，甚至因部门而异。即使在员工层面，采纳过程也不太可能是平滑的。有些人会欣然接受AI，尽管他们更可能接受的是让他们从单调乏味的工作部分中解放出来的AI，而不是承诺（或威胁）执行更有创造性和/或战略性部分的AI。

其他人，特别是那些担心自己的工作将被AI完全取代的人，可能会抵制整个过程。总的来说，我们已经看到预测性和生成性AI在大多数行业中的应用实例，我们知道更复杂和有能力的机器人和Agent即将到来。

自主工作对商业的影响包括三个重要方面：

首先，AI的发展将分为增强（1-3级）和替代（4级以上）两个阶段。增强阶段中，AI将提升工作效率，释放人类从事战略和创造性工作。替代阶段中，AI将快速取代人类工作。

其次，AI将加速公司的运营周期，通过SUDA模型（感知、理解、决策、行动）提升公司的反应速度和决策优势。

第三，AI将超越人类能力，处理复杂、准确和快速的任务，其能力将不再以人力单位衡量，而是以机器能力来衡量。

从整个认知框架来看，在某个阶段可能在五年左右的时间里，AI将开始接管整个工作角色，从最“程序化”或基于规则的工作开始。最终，它将获得足够的决策和编排能力来接管整个团队甚至业务线。

我们距离AGI还有多远？

终于到了本文最后一部分。

前面说了那么多关于AI Agent的分类、分类和认知，并且很有可能我们会乘着智能体的阶梯到达AGI的彼岸。那么到底什么时候才能实现AGI呢？

5月份，来自伊利诺伊大学香槟分校的研究团队及其合作者，发表了一篇名为《How Far Are We From AGI?》的论文。这篇120页的论文，首先阐述了AGI所需的能力框架，整合了内部、界面和系统三个维度。由于实现AGI需要更先进的能力和严格的约束条件，他们进一步讨论了必要的 AGI 协调技术，来协调这些因素。

论文地址：https://arxiv.org/html/2405.10313v1#S4