OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent;比尔·盖茨在2023年曾预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。

AI Agent 面面观

· 自主性:Agent 能够根据自身的知识和经验,独立做出决策和采取行动。

· 适应性:Agent 能够学习和适应环境,不断提高自己的能力。

· 交互性:Agent 能够与人类进行交互,提供信息和服务。

· 功能性:Agent 可以在特定领域内执行特定的任务。

博学:海纳百川,基于海量数据的训练。

审问:接受清晰明确的指令,即有效的提示工程。

慎思:在精巧设计的模式下认知,配置 CoT、ToT、ReAct 等思维框架。

明辨:明确地遵循人类道德规范,通过指令微调和价值对齐来确保AI安全无害。

笃行:借助 ToolCalls 和 Function Calling 等技术工具与外界交互。

动手玩转 AI Agent

基础知识

技术工具

· OpenAI API 以及 OpenAI Assistants:用于调用包含 GPT-4 模型 和 DALL·E 3 模型在内的众多人工智能模型。

· LangChain:开源框架,专门用于构建和开发由大型语言模型驱动的应用程序,其中包含对 ReAct 框架的封装和实现。

· LlamaIndex:开源框架,用于帮助管理和检索非结构化数据,利用大模型的能力和 Agent 框架来提高文本检索的准确性、效率和智能程度。

项目实战

· Agent 1:自动化办公项目,通过 Assistants API 和 DALL·E 3 模型创作 PPT。

· Agent 2:多功能选择的引擎,通过 Function Calling 调用函数。

· Agent 3:推理与行动的协同,通过 LangChain 中的 ReAct 框架实现自动定价。

· Agent 4:计划和执行的解耦,通过 LangChain 中的 Play-and-Execute 实现智能调度库存。

· Agent 5:知识的提取与整合,通过 LlamaIndex 实现检索增强生成 Agent。

· Agent 6:GitHub 的网红聚落,AutoGPT、BabyAGI 和 CAMEL。

· Agent 7:多 Agent 框架,AutoGen 和 MetaGPT。

结语

点击下方,即可5折起购书

微信扫码关注该文公众号作者

Source

 
 
 
 
Visited 1 times, 1 visit(s) today
Subscribe
Notify of
guest
0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x