OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent;比尔·盖茨在2023年曾预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。
AI Agent 面面观
· 自主性:Agent 能够根据自身的知识和经验,独立做出决策和采取行动。
· 适应性:Agent 能够学习和适应环境,不断提高自己的能力。
· 交互性:Agent 能够与人类进行交互,提供信息和服务。
· 功能性:Agent 可以在特定领域内执行特定的任务。
博学:海纳百川,基于海量数据的训练。
审问:接受清晰明确的指令,即有效的提示工程。
慎思:在精巧设计的模式下认知,配置 CoT、ToT、ReAct 等思维框架。
明辨:明确地遵循人类道德规范,通过指令微调和价值对齐来确保AI安全无害。
笃行:借助 ToolCalls 和 Function Calling 等技术工具与外界交互。
动手玩转 AI Agent
基础知识
技术工具
· OpenAI API 以及 OpenAI Assistants:用于调用包含 GPT-4 模型 和 DALL·E 3 模型在内的众多人工智能模型。
· LangChain:开源框架,专门用于构建和开发由大型语言模型驱动的应用程序,其中包含对 ReAct 框架的封装和实现。
· LlamaIndex:开源框架,用于帮助管理和检索非结构化数据,利用大模型的能力和 Agent 框架来提高文本检索的准确性、效率和智能程度。
项目实战
· Agent 1:自动化办公项目,通过 Assistants API 和 DALL·E 3 模型创作 PPT。
· Agent 2:多功能选择的引擎,通过 Function Calling 调用函数。
· Agent 3:推理与行动的协同,通过 LangChain 中的 ReAct 框架实现自动定价。
· Agent 4:计划和执行的解耦,通过 LangChain 中的 Play-and-Execute 实现智能调度库存。
· Agent 5:知识的提取与整合,通过 LlamaIndex 实现检索增强生成 Agent。
· Agent 6:GitHub 的网红聚落,AutoGPT、BabyAGI 和 CAMEL。
· Agent 7:多 Agent 框架,AutoGen 和 MetaGPT。
结语
▼点击下方,即可5折起购书
微信扫码关注该文公众号作者