Agent的一点碎碎念

不就是互相调用大模型吗？

Q：不是很理解agent是啥意思，代码看着就是几个模型之间互相调用，那跟系统不同模块之间互相调用有啥区别吗？为啥不叫大模型系统呢？

A1：现在 Al agent国内一般翻译成智能体，agent、本身的含义是“代理人”，我理解其核心思想是人类只需要传达你的意图和要求，具体怎么规划、执行、实现目标是由这个“代理人”去完成的（涉及到意图理解、规划拆分、工具调用、知识检索等）。由于大语言模型的意图理解和自然语言交互等能力很强，现在的agent基本上都是基于llm为核心的架构。workflow或许是一种折中的形态，很多任务还是需要人为定义一些标准的流程，大模型还没有强大到完全自动规划所有场景问题。这可能也是AGI的最终目标吧？

A2：普通的模块调用是写死的，if else。智能体突出智能两个字，能够决策什么时候调用工具以及调用什么工具。

A3：你说大白话的话大家都能看懂了，没人投资了，你搞个类人概念，热度一下就起来了。

A4：我跟你有一模一样的疑问！！！我现在的理解是，两者确实非常类似，唯一的区别是–传统系统里，工作流调度不同模块的方式是硬编码if else 这样非常死板处理不了edge case，没有context 可能写着写看if else 会越来越多；agent系统里，由IIm做决策调用哪个模块哪个工具，而由于IIm有一定的理解能力，有context，所以它可以能覆盖更广泛的逻辑。

A5: 有朋友对 agent的观点是“底层技术就是一个 workflow engine + 无数的prompt” 總可能很多人角度不同，定义也不一样，但说白了 agent的核心就是利用大语言模型（LLM）来完成任务。

A6: 好听毕竟大模型不是你搞的，你只是调用一下，最多自己写个prompt让输出更稳定。比如旅游代理，他可以卖机票，也可以卖宾馆住宿，也可以卖一条龙服务，实际上就是..AI二道贩子（套壳）皇帝的新装。

A7: 服务端的程序叫Service，移动端的程序叫 APP，基于LLM的程序叫做Agent，我觉得就是一类程序的代称而已。

A8: 我的理解是你让大模型一次提示词干一件事，那他就会非常的蠢。你要自己能把这件事情分拆成不同的步骤，你拆的越细，它实现效果越好。Agent就是有一些预定的规则来决定要拆几步，然后把提示词分步喂给模型，确保输出更好的结果。也有可能规则不是写死的，而是叫另外一个大模型聊天框，专门负责把要问的问题拆成更多的小问题。

A9：你可以把一个 agent抽象理解为一个人或者一个机器人，这个人/机器人有记忆，反思，或调用工具等各种各样的功能模块。然后，现在有很多个这样的agent/人/机器人，他们在一起交互，形成一个更大的多agent系统。但是每一个agent是相对独立的，他们可能并不共享记忆和工具，或者可能他们的基础Ilm都是不一样的。

A10：传统系统里的模块调用工具是自己决策的吗感觉应该是硬编码的？如果是代码写的话可能这就是
传统系统和结合IIm的多智能体系统的区别？

AI的三阶段进化

92IT

Just love IT.

Agent的一点碎碎念