谷歌:什么是 AI 智能体?

来源 | 谷歌

什么是 AI 智能体

AI 智能体是使用 AI 来实现目标并代表用户完成任务的软件系统。其表现出了推理、规划和记忆能力,并且具有一定的自主性,能够自主学习、适应和做出决定。

这些功能在很大程度上得益于生成式 AI 和 AI 基础模型的多模态功能。AI 智能体可以同时处理文本、语音、视频、音频、代码等多模态信息;可以进行对话、推理、学习和决策。它们可以随着时间的推移不断学习,并简化事务和业务流程。智能体可以与其他智能体协作,来协调和执行更复杂的工作流。

AI 智能体的主要功能

如上所述,虽然 AI 智能体的主要功能是推理和执行,但随着时间的推移,更多功能也随之发展起来。

  • 推理:此核心认知过程涉及使用逻辑和可用信息来得出结论、进行推断及解决问题。具有强大推理能力的 AI 智能体可以分析数据、识别模式,并根据证据和上下文做出明智的决策。
  • 行动:根据决策、计划或外部输入采取行动或执行任务的能力对于 AI 智能体与其环境进行互动和实现目标至关重要。这可能包括具身 AI 的物理动作,或发送消息、更新数据或触发其他流程等数字操作。
  • 观察:通过感知或感应收集有关环境或情况的信息,对于 AI 智能体了解上下文并做出明智的决策至关重要。这可能涉及各种形式的感知,例如计算机视觉、自然语言处理或传感器数据分析。
  • 规划:制定实现目标的战略计划是智能行为的关键方面。具有规划能力的 AI 智能体可以确定必要的步骤、评估潜在行动,并根据可用信息和预期结果选择最佳行动方案。这通常涉及预测未来状态和考虑潜在障碍。
  • 协作:在复杂且动态的环境中,与他人(无论是人类还是其他 AI 智能体)有效协作来实现共同目标变得越来越重要。协作需要沟通、协调以及理解和尊重他人观点的能力。
  • 自我完善:自我改进和自适应能力是高级 AI 系统的标志。具有自我完善能力的 AI 智能体可以从经验中学习,根据反馈调整行为,并随着时间的推移不断提升性能和能力。这可能涉及机器学习技术、优化算法或其他形式的自行修改。

AI 智能体、AI 助理和聊天机器人有什么区别?

AI 助理是作为应用或产品而设计的 AI 智能体,可通过理解和响应自然人类语言和输入内容,与用户直接协作并执行任务。其可以在用户的监督下进行推理并代表用户采取行动。

AI 助理通常嵌入在所使用的产品中。一个关键特征是,助理和用户在任务的不同步骤中进行互动。助理会响应用户的请求或提示,且可以推荐操作,但决策由用户做出。

AI 智能体

AI 助理

聊天机器人

用途

自主、主动地执行任务

协助用户执行任务

自动执行简单任务或对话

功能

可以执行复杂的多步骤操作;学习和适应;可以独立做出决策

响应请求或提示;提供信息并完成简单任务;可以推荐操作,但决策由用户做出

遵循预定义的规则;有限的学习能力;基本互动

交互

主动;以目标为导向

被动;响应用户请求

被动;响应触发器或命令

主要区别

  • 自主性:AI 智能体具有最高程度的自主性,能够独立操作并做出决策来实现目标。AI 助理不太自主,需要用户输入和指示。聊天机器人自主性最低,通常遵循预先编写的规则。
  • 复杂性:AI 智能体旨在处理复杂的任务和工作流,而 AI 助理和聊天机器人则更适合处理简单的任务和互动。
  • 学习:AI 智能体通常会利用机器学习来不断适应并提高性能。AI 助理可能具有一定的学习能力,而聊天机器人通常只有有限的学习能力或没有学习能力。

AI 智能体的工作原理

每个智能体都定义了角色、个性和沟通风格,包括具体指令和可用工具的说明。

  • 角色:定义良好的角色可让智能体保持一致的性格,并以适合其分配角色的方式行事,随着智能体获得经验并与环境互动而不断发展。
  • 记忆:智能体通常配备短期记忆、长期记忆、共识记忆及情景记忆。短期记忆用于即时互动,长期记忆用于历史数据和对话,情景记忆用于过去的互动,共识记忆用于智能体之间的共享信息。智能体可以回忆过去的互动并适应新情况,从而保持上下文、从经验中学习并提高性能。
  • 工具:工具是智能体可以利用的函数或外部资源,用于与环境互动并增强功能。工具可让智能体访问信息、处理数据或控制外部系统来执行复杂的任务,并且可以根据界面进行分类,包括物理界面、图形界面和基于程序的界面。工具学习包括教智能体如何通过了解工具的功能及其应用场景,来有效地使用这些工具。
  • 模型:大语言模型 (LLM) 是构建 AI 智能体的基础,为智能体提供理解、推理和行动的能力。LLM 充当智能体的“大脑”,使其能够处理和生成语言,而其他组件则促进推理和行动。

AI 中的智能体有哪些类型?

可以根据 AI 智能体的功能、角色和环境,以多种方式对其进行分类。以下是一些主要的智能体类别:

智能体类型和智能体类别具有不同的定义。

基于互动

一种对智能体进行分类的方法是根据它们与用户的互动方式。有些智能体会直接与用户对话,而有些智能体则在后台运行,无需用户直接输入即可执行任务:

  • 互动式合作伙伴(也称为表面智能体)- 协助我们执行客户服务、医疗保健、教育和科学发现等任务,提供个性化和智能支持。对话智能体包括与人类进行问答、闲聊和世界知识互动。它们通常由用户查询触发,并执行用户查询或事务。
  • 自主后台处理(也称为后台智能体)- 在后台运行以自动执行常规任务、分析数据以获取数据洞见、优化流程以提高效率,并主动识别和解决潜在问题。其中包括工作流智能体。它们与人类的互动有限或没有互动,通常由事件驱动,并执行排队的任务或任务链。

根据智能体数量

  • 单个智能体:独立运作来实现特定目标。其利用外部工具和资源来完成任务,从而增强在不同环境中的功能。最适合用于不需要与其他 AI 智能体协作的明确具体的任务。只能处理一个基础模型进行其处理。
  • 多智能体:通过协作或竞争来实现共同目标或各自目标的多个 AI 智能体。这些系统利用各个智能体的不同能力和角色,来处理复杂的任务。多智能体系统可以在互动场景中模拟人类行为,例如人际沟通。每个智能体都可以拥有最适合其需求的基础模型。

使用 AI 智能体的优点

AI 代理可以通过工具和体现来提供自主性、任务自动化以及与现实世界互动的能力,从而增强语言模型的能力。

效率和生产力

提高产量:代理会像专业工人一样分工协作,从而提高整体工作效率。

同时执行:代理可以同时处理不同的事务,而不会相互干扰。

自动化:代理可处理重复性任务,让人类有更多时间从事更具创造性的工作。

改善决策流程

协作:客服人员一起工作、辩论想法并相互学习,从而做出更好的决策。

适应能力:客服人员可以根据情况的变化调整其计划和策略。

强大的推理能力:通过讨论和反馈,客服人员可以优化推理过程并避免出错。

增强的功能

解决复杂问题:代理可以结合各自的优势来解决具有挑战性的现实问题。

自然语言沟通:代理可以理解和使用人类语言与用户和其他代理进行交互。

工具使用:代理可以使用工具和获取信息来与外部世界互动。

学习和自我提升:代理会从经验中学习,并随着时间的推移变得更出色。

社交互动和模拟

逼真模拟:代理可以模拟类似人类的社交行为,例如建立关系和分享信息。

涌现行为:复杂的社会互动可以从个体代理的互动中自然产生。

使用 AI 智能体的挑战

虽然 AI 代理带来了诸多好处,但在使用过程中也存在一些挑战:

需要深度同理心/情商或需要复杂的人际互动和社会动态的任务 – AI 代理在处理细微的人性情感方面可能力不从心。治疗、社会工作或冲突解决等任务需要一定程度的情感理解和共情,而 AI 目前还不具备这些能力。它们可能在需要理解隐晦暗示的复杂社交场合中表现不佳。

具有较高道德风险的情况 – AI 代理可以根据数据做出决策,但它们缺乏在道德复杂情境中所需的道德准则和判断力。这包括执法、医疗保健(诊断和治疗)和司法决策等领域。

具有不可预测的物理环境的领域 – 在实时适应性和复杂的运动技能至关重要的不可预测的高度动态物理环境中,AI 代理可能难以胜任。这包括手术、某些类型的建筑工作和灾难应对等任务。

资源密集型应用 – 开发和部署复杂的 AI 代理可能需要大量的计算资源和普通资源,这可能使其不适合较小的项目或预算有限的组织。

AI 智能体的应用场景

组织一直在部署智能体来解决各种应用场景,我们将这些应用场景归为以下六个主要类别:

客户服务智能体

客户服务智能体将通过了解客户需求、答疑、解决客户问题或推荐合适的产品和服务来提供个性化的客户体验。 它们可跨多个渠道(包括网站、移动设备或销售终端)无缝工作,并可与支持语音或视频的产品体验相结合。

员工服务智能体

员工服务智能体可通过简化流程、管理重复性任务、回答员工问题以及编辑和翻译关键内容和通信内容来提高工作效率。

创意服务智能体

创意服务智能体可以生成内容、图像和创意,协助设计、撰写、个性化和制作广告系列,从而为设计和创意过程注入强劲动力。

数据服务智能体

数据代理是为复杂的数据分析而构建的。它们能够发掘数据中的有意义的洞见并据此做出响应,同时可确保其结果的事实完整性。

代码服务智能体

代码服务智能体可利用依托 AI 技术的代码生成和编码辅助功能来加速软件开发,并快速上手使用新的语言和代码库。许多组织都看到了生产效率的显著提升,这使得部署速度更快,代码更简洁、更清晰。

安全服务智能体

安全服务智能体可以通过缓解攻击或加快调查速度来改善安全状况。它们可以监督安全生命周期的各个阶段(预防、检测和响应)和各个方面。

版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:RyanLin007),谢谢!

(0)
上一篇 2025年5月24日 下午2:17
下一篇 2025年6月1日 上午12:42

相关推荐

  • 大模型专业名词解释手册

    来源 | 微信公众号 【Agent案例库】 本手册由青崖设计提示词,Manus完成创作 前言 随着人工智能技术的飞速发展,大语言模型(Large Language Models, …

    2025年5月24日
  • 金融大模型落地实践

    分享嘉宾|杨剑 奇富科技 高级算法总监出品社区|DataFun 奇富科技是中国卓越的人工智能驱动的信贷科技服务平台,目前合作的金融机构超越 150 家,有 2 亿 + 注册用户,累…

    2024年1月16日
  • 谷歌:什么是生成式 AI?

    生成式 AI(生成式人工智能)是指使用 AI 来创作新内容,例如文本、图片、音乐、音频和视频。 生成式 AI 基于可以执行多任务处理和执行开箱即用任务(包括总结、问答、分类等)的基…

    2025年6月1日
  • AI大模型助力中小银行跨越“智能化鸿沟”

    以ChatGPT为代表的AI大模型正在全球范围内引发新一轮的技术革命与商业浪潮。在金融领域,短期来看,它将在哪些方面给客户带来直观的优化体验?长远来看,它能否给金融业带来颠覆性变革…

    2023年4月17日
  • 多模态大语言模型(MLLM)发展与展望

    分享嘉宾|殷述康 中国科学技术大学 博士在读编辑整理|张慕言内容校对|李瑶出品社区|DataFun 随着人工智能技术的快速发展,多模态大语言模型(MLLM)正成为研究和应用的新热点…

    2024年11月5日
  • 2023深圳湾零售银行大会——ChatGPT推动的大模型LLM应用,银行如何应对这个“奇点”

    2023深圳湾零售银行大会——ChatGPT推动的大模型LLM应用,银行如何应对这个“奇点”已加入人工智能专题资料包,本专题提供最新人工智能研究报告,人工智能技术,人工智能培训分享等相关领域学习资料与研究报告,帮助你全面了解人工智能发展趋势。

    2023年6月13日