AI Agent,大模型时代重要落地方向
智能体agent:通过传感器感知环境(收集信息)并通过执行器作用于该环境(采取行动)的事物。
Agent概念最早起源于M.Minsky(AI之父之一)于1986年出版的《SocietyofMind》(也是神经网络热潮开始的年份),1994年AI学术界内便已开始较多对agent的讨论,本篇报告我们采用22年出版的《人工智能:现代方法》(第四版)中的定义。
理性智能体概念是研究人工智能方法的核心。区别于普通计算机程序,理性智能体具备自主性、可学习迭代、可制定并实现目标等特点。人工智能专注于研究和构建做正确的事情的智能体——理性智能体(RationalAgent/IntelligentAgent,也是本报告“AIAGENT”定义),即设计理性智能体程序实现智能体函数,完成从感知到动作的映射。
对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。
大模型时代的AIAGENT=LLM(核心控制器,构建核心能力)+规划能力+记忆+工具。其中基座模型能力至关重要。
我们认为LLM给AIAGENT底层提供了一个突破性技术方案:过去强化学习基于深度学习框架可让agent学到技能,但agent本身并没有真正理解问题和技能,泛化性也较差,只能用于特定领域,主要用在游戏和用来制作低维控制/计划,代表性应用是围棋领域的AlphaGo;LLM带来了深度学习新范式,思维链和强大的自然语言理解能力有望让agent具备强大的学习能力和迁移能力,从而让创建广泛应用且实用的agent成为可能。
由于生成式LLM存在幻觉问题,记忆力短,在实际应用中难以保持长期一致性和准确性,且agent间合作也是重要趋势,除了等待基座模型自身迭代之外,借助外部力量(向量存储、检索、代码等)是重要方法,完整的AGENT框架应该具备这些能力。我们认为补齐了大模型短板的AIAGENT更具备实用性,将是大模型重要落地方向。
前特斯拉总监、OpenAI科学家Karpathy公开表示“如今AI智能体才是未来最前沿的方向”“相比大模型训练,OpenAI内部目前更关注Agent领域”。
来源:东吴证券
报告内容节选如下: