AI

Agent的一点碎碎念

不就是互相调用大模型吗?


Q:不是很理解agent是啥意思,代码看着就是几个模型之间互相调用,那跟系统不同模块之间互相调用有啥区别吗?为啥不叫大模型系统呢?

A1:现在 Al agent国内一般翻译成智能体,agent、本身的含义是“代理人”,我理解其核心思想是人类只需要传达你的意图和要求,具体怎么规划、执行、实现目标是由这个“代理人”去完成的(涉及到意图理解、规划拆分、工具调用、知识检索等)。由于大语言模型的意图理解和自然语言交互等能力很强,现在的agent基本上都是基于llm为核心的架构。workflow或许是一种折中的形态,很多任务还是需要人为定义一些标准的流程,大模型还没有强大到完全自动规划所有场景问题。这可能也是AGI的最终目标吧?

A2:普通的模块调用是写死的,if else。智能体突出智能两个字,能够决策什么时候调用工具以及调用什么工具。

A3:你说大白话的话大家都能看懂了,没人投资了,你搞个类人概念,热度一下就起来了。

A4:我跟你有一模一样的疑问!!!我现在的理解是,两者确实非常类似,唯一的区别是–传统系统里,工作流调度不同模块的方式是硬编码if else 这样非常死板处理不了edge case,没有context 可能写着写看if else 会越来越多;agent系统里,由IIm做决策调用哪个模块哪个工具,而由于IIm有一定的理解能力,有context,所以它可以能覆盖更广泛的逻辑。

A5: 有朋友对 agent的观点是“底层技术就是一个 workflow engine + 无数的prompt” 總可能很多人角度不同,定义也不一样,但说白了 agent的核心就是利用大语言模型(LLM)来完成任务。

A6: 好听毕竟大模型不是你搞的,你只是调用一下,最多自己写个prompt让输出更稳定。比如旅游代理,他可以卖机票,也可以卖宾馆住宿,也可以卖一条龙服务,实际上就是..AI二道贩子(套壳)皇帝的新装。

A7: 服务端的程序叫Service,移动端的程序叫 APP,基于LLM的程序叫做Agent,我觉得就是一类程序的代称而已。

A8: 我的理解是你让大模型一次提示词干一件事,那他就会非常的蠢。你要自己能把这件事情分拆成不同的步骤,你拆的越细,它实现效果越好。Agent就是有一些预定的规则来决定要拆几步,然后把提示词分步喂给模型,确保输出更好的结果。也有可能规则不是写死的,而是叫另外一个大模型聊天框,专门负责把要问的问题拆成更多的小问题。

A9:你可以把一个 agent抽象理解为一个人或者一个机器人,这个人/机器人有记忆,反思,或调用工具等各种各样的功能模块。然后,现在有很多个这样的agent/人/机器人,他们在一起交互,形成一个更大的多agent系统。但是每一个agent是相对独立的,他们可能并不共享记忆和工具,或者可能他们的基础Ilm都是不一样的。

A10:传统系统里的 模块调用工具是自己决策的吗 感觉应该是硬编码的?如果是代码写的话 可能这就是
传统系统和结合IIm的多智能体系统的区别?

 

AI的三阶段进化