AI Agent 从零到精通:小白如何一步步学会使用和创造 AI AgentAI AgentAIAI人工智能
AI Agent 从零到精通:小白如何一步步学会使用和创造 AI Agent?
写在前面:2026 年,AI Agent 已经不是什么高深概念了——它就是能替你干活的 AI 员工。但网上教程要么太专业看不懂,要么太浅尝辄止。这篇文章专为零基础小白设计,用最通俗的语言,带你从"啥是 Agent"到"我能造 Agent"。
全文约 12000 字,建议收藏后分阶段阅读。
零、先回答一个问题:为什么要学 Agent?
你可能觉得:ChatGPT 也能聊天,为什么还要学 Agent?
举个例子你就懂了:
| 场景 | 普通聊天机器人 | AI Agent |
|---|---|---|
| "帮我查一下明天北京天气" | "我无法联网,建议你打开天气APP查看" | 自动调用天气API → 告诉你"明天北京28°C,晴" |
| "帮我总结这份PDF" | "请把内容复制粘贴给我" | 自己读取文件 → 自动总结 → 还能回答追问 |
| "帮我监控竞品价格" | "这超出了我的能力范围" | 定时抓取网页 → 发现降价自动发微信通知你 |
一句话总结:
普通 AI 是"只会说的军师",Agent 是"能说又能干的将军"。
学会了 Agent,你就能让 AI 真正替你工作,而不只是陪你聊天。
一、什么是 AI Agent?(5 分钟搞懂核心概念)
1.1 用一个故事理解 Agent
想象你开了一家公司,招了一个员工叫"小智":
- 你下达任务:"帮我调研一下 Agent 框架的市场情况"
- 小智思考(Thought):"我需要先搜索相关信息"
- 小智行动(Action):打开浏览器搜索
- 小智观察(Observation):看到了几篇有用的文章
- 小智再思考:"我需要更详细的数据,去 GitHub 看看"
- 小智再行动:访问 GitHub,收集 Star 数、更新频率
- 小智再观察:"数据够了,可以总结了"
- 小智输出报告:给你一份完整的调研结果
这就是一个 Agent 的工作方式 —— 也就是大名鼎鼎的 ReAct 循环(Reasoning + Acting)。
1.2 Agent 的四个核心部件
把 Agent 想象成一个打工人,它需要四样东西:
┌──────────────────────────────────────┐
│ AI Agent │
│ │
│ 🧠 大脑(LLM):负责理解和思考 │
│ → 就像 GPT-4、Claude、通义千问 │
│ │
│ 🛠 工具(Tools):手和脚 │
│ → 搜索、发邮件、读文件、写代码 │
│ │
│ 📝 记忆(Memory):记事本 │
│ → 记住之前的对话和经验 │
│ │
│ 📋 规划(Planning):工作计划 │
│ → 把大任务拆成小步骤 │
│ │
└──────────────────────────────────────┘
| 部件 | 通俗解释 | 类比 |
|---|---|---|
| LLM(大脑) | 大语言模型,负责理解、推理、生成文本 | 一个超级聪明的人 |
| Tools(工具) | Agent 可以调用的外部能力:搜索、计算器、API | 给聪明人装上"手和脚" |
| Memory(记忆) | 短期记忆(对话上下文)+ 长期记忆(历史经验) | 打工人的笔记本 |
| Planning(规划) | 把复杂任务拆成可执行的步骤 | 打工人的工作计划表 |
1.3 Agent 和普通 AI 聊天的本质区别
普通聊天 AI:
用户提问 → AI 回答 → 结束
AI Agent:
用户提问 → AI 思考 → 调用工具 → 观察结果 → 继续思考
→ 可能再调用另一个工具 → 观察结果 → ... → 给出最终答案
关键区别:Agent 有一个循环,它能多步思考和行动,直到任务完成。
二、当前 Agent 生态全景(你知道有哪些 Agent 吗?)
2.1 Agent 框架(开发者造 Agent 的工具)
| 框架 | 谁做的 | Stars | 特点 | 适合阶段 |
|---|---|---|---|---|
| LangChain | 社区 | 100k+ | 生态最大,工具最多 | 🟡 使用阶段 |
| LangGraph | LangChain 团队 | 10k+ | 流程图式编排,控制力强 | 🟠 原理阶段 |
| smolagents | HuggingFace | 12k+ | 极简,代码少,适合读源码 | 🟠 原理阶段 |
| CrewAI | 社区 | 25k+ | 多 Agent 协作,代码易懂 | 🔴 创造阶段 |
| AutoGen | 微软 | 40k+ | 多 Agent 对话协作 | 🔴 创造阶段 |
| Hermes Agent | NousResearch | 新秀 | 自我进化、学习闭环 | 🔴 参考学习 |
2.2 Agent 产品(直接用的,不用写代码)
| 产品 | 做什么 | 是否免费 |
|---|---|---|
| ChatGPT + GPTs | 创建自己的定制 GPT | Plus 付费 |
| Coze(扣子) | 拖拽式搭建 Agent | 免费 |
| Dify | 开源 Agent 平台 | 免费开源 |
| FastGPT | 知识库 Agent | 免费开源 |
| ** Manus ** | 通用 AI Agent,自动完成任务 | 邀请制 |
2.3 Agent 的应用场景
🎯 编程助手 → 自动写代码、Debug、代码审查
📊 数据分析 → 自动处理 Excel、生成报表
🔍 信息搜索 → 自动搜索、整理、总结信息
📧 办公自动化 → 自动处理邮件、文档、日程
🛒 电商运营 → 自动选品、写文案、监控竞品
🎮 游戏NPC → 智能对话、自主决策
📱 个人助手 → 日程管理、信息提醒、学习辅导
三、阶段一:搞懂 Agent 概念(1-2 周)
目标:理解 Agent 的核心概念,能和别人聊 Agent 不露怯
3.1 必学的 6 个概念
我按"理解顺序"排列,每个概念都依赖上一个:
① LLM(大语言模型)— Agent 的大脑
什么是 LLM?
- 就是 ChatGPT、Claude、通义千问背后的技术
- 它能理解文字、生成文字、推理逻辑
- 但它只能"想",不能"做"
类比:一个超级聪明但被困在房间里的人
② Prompt(提示词)— 你怎么指挥 Agent
什么是 Prompt?
- 就是你发给 AI 的指令
- 好的 Prompt = 清晰的任务描述 + 约束条件 + 输出格式
例子:
❌ 差的 Prompt:"帮我分析一下市场"
✅ 好的 Prompt:"请分析 2026 年 AI Agent 市场的三个趋势,
每个趋势给出一个具体的公司案例,用表格呈现"
③ Function Calling(函数调用)— Agent 的手
什么是 Function Calling?
- 让 LLM 能够"调用外部工具"
- LLM 不直接执行,而是告诉你"我想调什么工具,传什么参数"
- 你的代码执行后,把结果喂回给 LLM
流程:
你 → LLM:"明天北京天气?"
LLM → 你:"我想调用 get_weather(city='北京')"
你 → 执行API → 结果:"28°C,晴"
你 → LLM:"工具返回了28°C,晴"
LLM → 你:"明天北京28°C,晴天,适合出门"
④ ReAct 循环 — Agent 的核心工作方式
ReAct = Reasoning(推理)+ Acting(行动)
循环过程:
Thought(思考)→ Action(行动)→ Observation(观察)→ Thought → Action → ... → 最终答案
这就是 Agent 能"多步完成任务"的秘密!
⑤ RAG(检索增强生成)— Agent 的参考书
什么是 RAG?
- Retrieval-Augmented Generation(检索增强生成)
- 简单说:先从知识库里找到相关内容,再让 AI 基于这些内容回答
类比:
- 不用 RAG = 让你闭卷考试
- 用了 RAG = 让你开卷考试,还能精准翻到对应页
⑥ Memory(记忆)— Agent 的笔记本
Agent 的记忆分两种:
短期记忆:记住当前对话的上下文
→ "刚才你说了要查天气,我已经查到了..."
长期记忆:记住历史经验和用户偏好
→ "你之前说过你住在北京,所以默认查北京天气"
3.2 推荐学习资源
| 资源 | 类型 | 链接/方式 |
|---|---|---|
| B站搜"AI Agent 通俗讲解" | 视频 | 选播放量 >10 万的 |
| 吴恩达 AI Agent 课程 | 免费课 | deeplearning.ai |
| Lilian Weng 博客 | 文章 | lilianweng.github.io |
| 直接问 ChatGPT/豆包 | 对话 | "用小白能懂的话解释什么是 AI Agent" |
3.3 阶段一检验
✅ 能回答以下问题就算过关:
1. Agent 和普通聊天机器人有什么区别?
2. 为什么 Agent 需要 Function Calling?
3. ReAct 循环是什么?为什么它很重要?
4. RAG 解决了什么问题?
四、阶段二:熟练使用 Agent(2-3 周)
目标:能用 Agent 产品和框架完成实际工作
4.1 如果你不会 Python(花 1 周速成)
只需学这些就够了:
# 1. 变量(存东西)
name = "小明"
age = 25
# 2. 列表(存一组东西)
tools = ["搜索", "计算器", "翻译"]
print(tools[0]) # 输出:搜索
# 3. 字典(存带标签的东西)
config = {"model": "gpt-4", "temperature": 0.7}
print(config["model"]) # 输出:gpt-4
# 4. if/else(做判断)
if age >= 18:
print("成年人")
# 5. for 循环(重复做事)
for tool in tools:
print(f"可用工具:{tool}")
# 6. 函数(封装一段逻辑)
def ask_agent(question):
# 调用 API 的代码
return "Agent 的回答"
# 7. 安装第三方包(在终端执行)
# pip install openai langchain
不需要学的(现阶段):类、装饰器、异步、多线程、设计模式。
4.2 Level 1:零代码搭建 Agent(体验,1 天)
方案 A:用 Coze(扣子)搭建你的第一个 Agent
步骤:
1. 打开 coze.cn,用手机号注册
2. 点击"创建 Bot"
3. 写提示词:"你是一个 AI 学习顾问,帮助用户学习 AI Agent"
4. 添加插件:搜索、网页读取
5. 配置知识库:上传几篇 AI Agent 教程的 PDF
6. 点"发布" → 在聊天窗口测试
全程不需要写一行代码!
方案 B:用 Dify 搭建工作流 Agent
步骤:
1. 打开 dify.ai,注册
2. 选择"创建空白应用" → 选"Agent"
3. 配置 LLM(选 GPT-4 或国产模型)
4. 添加工具(搜索、天气、计算器等)
5. 在画布上拖拽连接,设计 Agent 的工作流
6. 测试并发布
Dify 是开源的,也可以本地部署!
4.3 Level 2:写代码使用 Agent 框架(2 周)
第一个代码 Agent(30 行代码搞定)
"""
你的第一个 AI Agent!
功能:一个能搜索 + 计算的智能助手
"""
from openai import OpenAI
client = OpenAI(api_key="your-api-key")
# 定义 Agent 可以使用的工具
tools = [
{
"type": "function",
"function": {
"name": "get_weather",
"description": "查询指定城市的天气",
"parameters": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "城市名"}
},
"required": ["city"]
}
}
}
]
# 模拟天气工具的执行
def get_weather(city):
# 实际项目中这里会调用真实的天气 API
weather_data = {
"北京": "28°C,晴天",
"上海": "25°C,多云",
"深圳": "32°C,雷阵雨"
}
return weather_data.get(city, f"{city}:数据暂无")
# Agent 主循环
messages = [{"role": "user", "content": "北京和上海明天天气怎么样?哪个更适合出门?"}]
# 第一轮:发送给 LLM
response = client.chat.completions.create(
model="gpt-4",
messages=messages,
tools=tools
)
message = response.choices[0].message
print(f"🤖 Agent 思考:{message}")
# 如果 Agent 决定调用工具
if message.tool_calls:
for tool_call in message.tool_calls:
if tool_call.function.name == "get_weather":
import json
args = json.loads(tool_call.function.arguments)
result = get_weather(args["city"])
print(f"🛠 执行工具:查询{args['city']}天气 → {result}")
# 把工具结果喂回给 LLM
messages.append(message)
messages.append({
"role": "tool",
"tool_call_id": tool_call.id,
"content": result
})
# 第二轮:LLM 基于工具结果生成最终回答
final_response = client.chat.completions.create(
model="gpt-4",
messages=messages,
tools=tools
)
print(f"\n💬 最终回答:{final_response.choices[0].message.content}")
# 输出示例:
# 🤖 Agent 思考:需要调用两次天气查询
# 🛠 执行工具:查询北京天气 → 28°C,晴天
# 🛠 执行工具:查询上海天气 → 25°C,多云
# 💬 最终回答:北京28°C晴天更适合出门,上海多云也可以但温度稍低。
看到没?这就是 Agent 的核心循环:思考 → 调工具 → 观察结果 → 再思考 → 最终回答
4.4 阶段二检验
✅ 能完成以下任务就算过关:
1. 在 Coze/Dify 上搭建一个有工具、有知识库的 Agent
2. 用 Python + OpenAI API 写一个能调用工具的 Agent
3. 理解 Function Calling 的完整流程
五、阶段三:理解 Agent 原理(3-4 周)
目标:看懂 Agent 框架源码,能手写一个简易 Agent
5.1 Agent 的完整工作流程
用户输入
↓
┌─────────────────────────────────┐
│ Agent 主循环 │
│ │
│ 1. 把用户消息 + 工具列表发给 LLM │
│ 2. LLM 决定: │
│ a. 直接回答 → 返回给用户 │
│ b. 调用工具 → 执行工具 │
│ → 把结果喂回 LLM │
│ → 回到步骤 1 │
│ 3. 循环直到 LLM 给出最终回答 │
│ │
└─────────────────────────────────┘
↓
返回结果给用户
5.2 手写一个最简 Agent(不用任何框架)
"""
手写一个最简 Agent,不用 LangChain 等框架
帮助你理解 Agent 的本质
"""
import json
from openai import OpenAI
client = OpenAI(api_key="your-api-key")
class SimpleAgent:
def __init__(self):
self.tools = {} # 注册的工具
self.messages = [] # 对话历史(短期记忆)
def register_tool(self, name, func, description, parameters):
"""注册一个工具"""
self.tools[name] = {
"func": func,
"schema": {
"type": "function",
"function": {
"name": name,
"description": description,
"parameters": parameters
}
}
}
def run(self, user_input, max_steps=5):
"""运行 Agent 主循环"""
self.messages.append({"role": "user", "content": user_input})
tool_schemas = [t["schema"] for t in self.tools.values()]
for step in range(max_steps):
print(f"\n--- 第 {step + 1} 步 ---")
# 1. 让 LLM 思考
response = client.chat.completions.create(
model="gpt-4",
messages=self.messages,
tools=tool_schemas if tool_schemas else None
)
msg = response.choices[0].message
self.messages.append(msg)
# 2. 检查是否需要调工具
if not msg.tool_calls:
# 不需要调工具,直接返回
print(f"💬 最终回答:{msg.content}")
return msg.content
# 3. 执行所有工具调用
for tool_call in msg.tool_calls:
tool_name = tool_call.function.name
tool_args = json.loads(tool_call.function.arguments)
print(f"🛠 调用工具:{tool_name}({tool_args})")
# 执行工具
if tool_name in self.tools:
result = self.tools[tool_name]["func"](**tool_args)
print(f"📊 工具返回:{result}")
else:
result = f"错误:未知工具 {tool_name}"
# 把结果喂回
self.messages.append({
"role": "tool",
"tool_call_id": tool_call.id,
"content": str(result)
})
return "达到最大步数限制,任务未完成。"
# ===== 使用示例 =====
agent = SimpleAgent()
# 注册工具
def calculate(expression):
"""安全计算数学表达式"""
try:
return str(eval(expression)) # 生产环境请用更安全的方式
except:
return "计算错误"
def search_web(query):
"""模拟网页搜索"""
fake_results = {
"Python": "Python 是最流行的编程语言之一,适合 AI 开发",
"Agent": "AI Agent 是能自主执行任务的智能体",
}
for key in fake_results:
if key.lower() in query.lower():
return fake_results[key]
return f"搜索'{query}':暂无结果"
agent.register_tool(
"calculate", calculate,
"计算数学表达式",
{"type": "object", "properties": {"expression": {"type": "string"}}, "required": ["expression"]}
)
agent.register_tool(
"search", search_web,
"搜索互联网信息",
{"type": "object", "properties": {"query": {"type": "string"}}, "required": ["query"]}
)
# 测试!
agent.run("帮我搜索一下什么是AI Agent,然后算一下 2026 * 3 等于多少")
5.3 读源码的建议顺序
第一步:读 smolagents(代码最少,最容易懂)
pip install smolagents
重点看:
- src/smolagents/agents.py — Agent 主循环
- src/smolagents/tools.py — 工具定义方式
- src/smolagents/models.py — 怎么调 LLM
第二步:用 LangChain 做项目
# LangChain 版本的简单 Agent
from langchain.agents import create_openai_tools_agent, AgentExecutor
from langchain.tools import tool
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
# 定义工具
@tool
def search_web(query: str) -> str:
"""搜索互联网信息"""
return f"搜索结果:{query} 的相关信息..."
@tool
def calculate(expression: str) -> str:
"""计算数学表达式"""
return str(eval(expression))
# 创建 Agent
llm = ChatOpenAI(model="gpt-4")
tools = [search_web, calculate]
prompt = ChatPromptTemplate.from_messages([
("system", "你是一个有用的AI助手,可以使用工具帮助用户。"),
("human", "{input}"),
("placeholder", "{agent_scratchpad}"),
])
agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)
# 运行
result = agent_executor.invoke({"input": "搜索AI Agent并计算100*25"})
print(result["output"])
5.4 阶段三检验
✅ 能完成以下任务就算过关:
1. 不用任何框架,纯 Python 手写一个能调工具的 Agent
2. 能看懂 smolagents 的核心源码
3. 能用 LangChain 搭建一个有 2+ 工具的 Agent
六、阶段四:独立创造 Agent 系统(持续精进)
目标:能根据实际需求设计和开发完整的 Agent 系统
6.1 实战项目路线
🟢 项目 1:个人知识库助手(入门级,1-2 周)
功能:
- 上传文档(PDF/Word/TXT)
- 自动分块 + 向量化
- 用户提问 → 自动检索相关内容 → 生成回答
技术栈:
- LangChain / LlamaIndex
- ChromaDB(向量数据库)
- OpenAI Embeddings + GPT-4
- Gradio / Streamlit(界面)
学到什么:
✅ RAG 的完整实现
✅ 向量数据库的使用
✅ 文档分块和检索策略
🟡 项目 2:自动化工作流 Agent(进阶级,2-3 周)
功能:
- 定时监控指定网页/数据源
- 自动分析变化
- 执行相应操作(发通知/生成报告)
- 记录历史数据
技术栈:
- LangGraph(工作流编排)
- 多个 Tool(网页抓取、邮件发送、数据库操作)
- 定时任务(APScheduler)
学到什么:
✅ 复杂工作流设计
✅ 多工具协作
✅ Agent 的定时调度
🔴 项目 3:多 Agent 协作系统(高级,3-4 周)
功能:
- 多个 Agent 扮演不同角色
- Agent 之间能对话和协作
- 自动分配任务、汇总结果
示例:AI 开发团队
- 产品经理 Agent:分析需求
- 程序员 Agent:写代码
- 测试员 Agent:测试代码
- 评审员 Agent:代码审查
技术栈:
- CrewAI / AutoGen
- 自定义 Agent 角色和工具
- Agent 间通信协议
学到什么:
✅ 多 Agent 系统设计
✅ 角色定义和任务分配
✅ Agent 间通信和协调
6.2 Agent 设计的 5 个原则
不管做什么 Agent,记住这 5 条:
原则 1:工具要单一职责
✅ 好的工具:search_web(query)、send_email(to, subject, body)
❌ 坏的工具:do_everything(action, params)
原则 2:Prompt 要清晰具体
✅ 好的 System Prompt:
"你是一个数据分析 Agent。
可用工具:search、calculate、read_csv、plot_chart。
工作方式:先收集数据,再分析,最后可视化。
回答语言:中文。
如果不确定,先调用工具确认,不要猜测。"
❌ 坏的 System Prompt:"你是一个助手"
原则 3:记忆要分层
短期记忆:当前对话(最近 10 轮)
中期记忆:今天的工作上下文
长期记忆:用户偏好、历史经验
原则 4:要有兜底机制
- 设置最大步数(防止死循环)
- 工具调用失败时要有备用方案
- 输出要有格式校验
- 关键操作要人工确认
原则 5:从简单开始,逐步迭代
第一版:1 个工具,能跑通
第二版:加 2-3 个工具
第三版:加记忆
第四版:加错误处理
第五版:加用户界面
七、保持学习:如何跟上 Agent 领域的发展
7.1 每日信息源(每天 15 分钟)
| 渠道 | 看什么 | 链接 |
|---|---|---|
| Twitter/X | AI 研究者实时动态 | 关注 @AndrewYNg @kaborabot @swyx |
| 机器之心 | 中文 AI 资讯 | ji!qizhixin.com |
| Hugging Face | 开源模型和项目 | huggingface.co |
| GitHub Trending | 最火的 AI 项目 | github.com/trending |
7.2 每周学习计划
| 任务 | 时间 | 具体做法 |
|---|---|---|
| 看 1 篇 Agent 论文 | 1 小时 | ArXiv 搜 "agent",读摘要 + 结论 |
| 跑 1 个 GitHub 项目 | 2 小时 | clone 下来跑通,改改参数 |
| 写 1 段 Agent 代码 | 2 小时 | 哪怕只加一个新工具也行 |
7.3 推荐关注的 GitHub 仓库
| 仓库 | 为什么关注 |
|---|---|
| langchain-ai/langchain | Agent 框架标杆,更新最活跃 |
| huggingface/smolagents | 极简 Agent,学原理首选 |
| crewAIInc/crewAI | 多 Agent 协作,代码易懂 |
| microsoft/autogen | 微软出品,多 Agent 对话 |
| NousResearch/hermes-agent | 自我进化的 Agent,前沿方向 |
| e2b-dev/awesome-ai-agents | AI Agent 资源大全 |
八、常见问题 FAQ
Q1:学 Agent 一定要会 Python 吗?
初期不一定!你可以先用 Coze/Dify 零代码体验。但想深入和创造,Python 是必须的。好消息是 Agent 方向需要的 Python 知识不多,1 周就能速成。
Q2:用哪个 LLM 做 Agent 最好?
- 预算充足:GPT-4(Function Calling 最稳)
- 性价比高:Claude 3.5 Sonnet
- 国产免费:通义千问 / DeepSeek
- 本地部署:LLaMA 3 / Qwen2
Q3:Agent 和 Workflow 有什么区别?
- Workflow:固定流程,A→B→C,每步都预设好
- Agent:动态决策,AI 自己决定走哪步
- 实际项目中经常混用:主干用 Workflow,分支用 Agent
Q4:学 Agent 需要学机器学习/深度学习吗?
不需要!Agent 是"应用层",你只需要会用 LLM 的 API,不需要理解模型训练。就像你会开车不需要会造发动机。
Q5:Agent 的安全风险怎么控制?
- 永远设置最大步数限制
- 危险操作(删除、转账)要人工确认
- 用沙箱环境运行代码
- 记录 Agent 的每一步操作日志
Q6:多久能从零到独立造 Agent?
按每天 2 小时学习计算:
- 能用 Agent:2-3 周
- 能看懂原理:1-2 个月
- 能独立创造:2-3 个月
- 能做出生产级项目:3-6 个月
九、学习路线总结
第 1-2 周 🟢 搞懂概念
└─ 看 3 个讲解视频 + 理解 ReAct 循环
第 3-5 周 🟡 熟练使用
└─ Coze 搭建 Agent + 学 Python + 写代码调 API
第 6-9 周 🟠 理解原理
└─ 手写 Agent + 读 smolagents 源码 + LangChain 实战
第 10 周+ 🔴 独立创造
└─ 做 3 个实战项目(知识库→工作流→多Agent)
十、学习资料汇总(宝藏资源一网打尽)
这是我精心整理的 Agent 学习资料大全,按类型分类,每个都标注了难度和推荐理由。建议收藏本文,随时查阅!
10.1 📚 必读书籍
| 书名 | 难度 | 推荐理由 |
|---|---|---|
| 《Build a Large Language Model (From Scratch)》 — Sebastian Raschka | ⭐⭐⭐ | 从零手把手教你训练一个 LLM,理解底层原理 |
| 《AI Agents in Action》 — Micheal Lanham | ⭐⭐ | 专门讲 Agent 开发的实战书,涵盖多种框架 |
| 《LLM Engineer's Handbook》 — Paul Iusztin | ⭐⭐⭐ | LLM 工程化最佳实践,包含 RAG、Agent、部署 |
| 《Designing Machine Learning Systems》 — Chip Huyen | ⭐⭐ | ML 系统设计思维,帮你理解 Agent 在系统中的定位 |
| 《Deep Learning》 — Ian Goodfellow | ⭐⭐⭐⭐ | 深度学习圣经,想深入 AI 底层再看(可选) |
💡 小白建议:先看第 2 本《AI Agents in Action》,直接上手 Agent 开发。
10.2 🎓 免费课程
| 课程 | 平台 | 时长 | 难度 | 链接 |
|---|---|---|---|---|
| AI Agents in LangGraph | DeepLearning.AI | 4 小时 | ⭐⭐ | deeplearning.ai |
| Multi AI Agent Systems with CrewAI | DeepLearning.AI | 3 小时 | ⭐⭐ | deeplearning.ai |
| Building Agentic RAG with LlamaIndex | DeepLearning.AI | 2 小时 | ⭐⭐ | deeplearning.ai |
| Functions, Tools and Agents with LangChain | DeepLearning.AI | 3 小时 | ⭐⭐ | deeplearning.ai |
| ChatGPT Prompt Engineering for Developers | DeepLearning.AI | 1 小时 | ⭐ | deeplearning.ai |
| CS50's Introduction to AI with Python | edX | 12 周 | ⭐⭐⭐ | cs50.harvard.edu |
| LangChain 官方教程 | LangChain Docs | 自定进度 | ⭐⭐ | python.langchain.com/docs |
| HuggingFace NLP Course | HuggingFace | 3 天 | ⭐⭐ | huggingface.co/learn |
💡 小白建议:先看 Prompt Engineering(1小时),再看 Functions/Tools/LangChain(3小时),最后看 Agents in LangGraph(4小时)。总计约 8 小时入门。
10.3 📺 YouTube / B站 频道
YouTube(英文,质量最高)
| 频道 | 内容风格 | 推荐视频 |
|---|---|---|
| LangChain | 官方教程,最权威 | "LangChain Agents Explained" 系列 |
| Nicholas Renotte | 手把手实战,超级详细 | "Build AI Agent from Scratch" |
| Dave Ebbelaar | Agent 开发实战,贴近实际 | "How to Build AI Agents" 系列 |
| Tech With Tim | Python + AI,适合入门 | "AI Agent Tutorial" |
| Sam Witteveen | Google DevExpert,深入浅出 | "LangChain Agents Deep Dive" |
| Andrej Karpathy | 前 OpenAI 联合创始人 | "Let's build GPT" 系列 |
| 3Blue1Brown | 可视化讲解 AI 原理 | "Neural Networks" 系列 |
| Yannic Kilcher | 论文解读,前沿动态 | 每周论文速递 |
B站(中文,更友好)
| UP主 | 内容风格 | 搜索关键词 |
|---|---|---|
| 李沐(动手学深度学习) | 学术大佬,讲得通俗易懂 | "AI Agent 通俗讲解" |
| 同济子豪兄 | 实战教程,代码详尽 | "LangChain Agent 教程" |
| 跟李沐学AI | 论文解读 + 代码实现 | "Agent 论文精读" |
| 技术蛋老师 | 短视频,快速了解概念 | "什么是 AI Agent" |
| AI garlic | AI 新闻 + 技术解读 | "Agent 最新进展" |
10.4 📖 必读文章 / 博客
经典文章(按阅读顺序排列)
| 文章 | 作者 | 为什么必读 |
|---|---|---|
| LLM Powered Autonomous Agents | Lilian Weng (OpenAI) | Agent 领域的圣经,最全面的 Agent 综述 |
| ReAct: Synergizing Reasoning and Acting in Language Models | Yao et al. | ReAct 模式的原始论文,理解 Agent 核心循环 |
| Toolformer | Schick et al. | AI 自动学习使用工具的里程碑论文 |
| Generative Agents: Interactive Simulacra | Stanford | 斯坦福"AI 小镇"论文,多 Agent 社交模拟 |
| A Survey on Large Language Model based Autonomous Agents | Fudan University | Agent 领域最全面的学术综述 |
优质博客 / 网站
| 网站 | 特色 | 链接 |
|---|---|---|
| Lilian Weng's Blog | OpenAI 研究员,文章质量极高 | lilianweng.github.io |
| LangChain Blog | 框架官方,最新特性介绍 | blog.langchain.dev |
| The Batch (Andrew Ng) | 吴恩达的 AI 周报 | deeplearning.ai/the-batch |
| Simon Willison's Weblog | Django 创始人,AI 工具深度体验 | simonwillison.net |
| Interconnects | Nathan Lambert,AI 前沿分析 | interconnects.ai |
| Ahead of AI | Sebastian Raschka,ML 研究 + 实战 | mag.sebastianraschka.com |
10.5 🛠 实战项目推荐(从易到难)
| 项目 | 难度 | 学到什么 | GitHub 链接 |
|---|---|---|---|
| 简易聊天机器人 | ⭐ | API 调用基础 | 自己手写 |
| RAG 知识库问答 | ⭐⭐ | 文档处理 + 向量检索 | github.com/langchain-ai/langchain |
| AI 搜索引擎 | ⭐⭐ | 搜索 + 总结 + 引用 | github.com/langchain-ai |
| Auto-coder(自动写代码) | ⭐⭐⭐ | 代码生成 + 执行 + 调试 | github.com/significant-gravitas/AutoGPT |
| AI 客服系统 | ⭐⭐⭐ | 多轮对话 + 意图识别 + 工具调用 | 自己搭建 |
| 多 Agent 协作开发 | ⭐⭐⭐⭐ | Agent 间通信 + 任务分配 | github.com/crewAIInc/crewAI |
| AI 操作系统(Computer Use) | ⭐⭐⭐⭐⭐ | 屏幕理解 + 自动操作 | github.com/All-Hands-AI/OpenHands |
10.6 📰 每日资讯获取渠道
| 渠道 | 更新频率 | 特色 | 链接/方式 |
|---|---|---|---|
| 机器之心 | 每日 | 国内最专业的 AI 媒体 | ji!qizhixin.com |
| 量子位 | 每日 | AI 资讯 + 深度分析 | qbitai.com |
| 新智元 | 每日 | AI 产业报道 | zhidx.com/ai |
| Twitter/X AI 圈 | 实时 | 研究者第一手动态 | 关注 @AndrewYNg @swyx @kaborabot |
| Reddit r/MachineLearning | 每日 | 学术 + 产业讨论 | reddit.com/r/MachineLearning |
| Reddit r/LocalLLaMA | 每日 | 本地模型 + 开源动态 | reddit.com/r/LocalLLaMA |
| Hugging Face Daily | 每日 | 开源模型和项目 | huggingface.co/papers |
| AI News Newsletter | 每周 | 一周 AI 大事汇总 | 订阅:theainewsletter.com |
| TLDR AI | 每日 | 5 分钟读完 AI 日报 | 订阅:tldrnewsletter.com |
10.7 🧰 开发工具和平台
| 工具 | 用途 | 是否免费 |
|---|---|---|
| Jupyter Notebook | 边写代码边实验,学 Agent 最佳环境 | ✅ 免费 |
| Google Colab | 免费云端 GPU,跑模型不用本地配置 | ✅ 免费 |
| Cursor / Windsurf | AI 辅助编程 IDE,写 Agent 代码效率翻倍 | 基础免费 |
| Docker | 隔离环境部署 Agent,避免依赖冲突 | ✅ 免费 |
| Streamlit | 快速给 Agent 做个 Web 界面 | ✅ 免费 |
| Gradio | 另一个快速做 AI 界面的工具 | ✅ 免费 |
| Postman | 测试 API 接口,调试 Agent 工具 | 基础免费 |
| HuggingFace Spaces | 免费部署和分享你的 Agent 项目 | ✅ 免费 |
10.8 🗺️ 学习路径速查表
小白入门路径(按顺序学,每个 1-2 天):
Day 1-2 📺 B站看 2-3 个 "AI Agent 通俗讲解" 视频
Day 3-4 📖 读 Lilian Weng 的 "LLM Powered Autonomous Agents"
Day 5-7 🎓 吴恩达 Prompt Engineering 课程(1小时)
Day 8-10 🎓 吴恩达 Functions/Tools/Agents 课程(3小时)
Day 11-14 🛠 用 Coze/Dify 搭建第一个 Agent(零代码)
Day 15-17 🎓 吴恩达 AI Agents in LangGraph 课程(4小时)
Day 18-21 💻 写第一个 Python Agent 代码(参考本文第四章)
Day 22-28 🛠 做项目:个人知识库 Agent(RAG)
Day 29-35 💻 读 smolagents 源码,理解原理
Day 36-42 🛠 做项目:自动化工作流 Agent
Day 43-56 🛠 做项目:多 Agent 协作系统
10.9 💡 高效学习小技巧
- 费曼学习法:学完一个概念,试着用大白话给别人讲一遍。讲不清楚 = 没学透
- 项目驱动:别光看教程,每学一个知识点就用到项目里
- 善用 AI 学 AI:遇到不懂的,直接问 ChatGPT "用小白能懂的话解释 xxx"
- 加入社区:LangChain Discord、HuggingFace Discord,和同路人交流
- 记笔记:用 Notion/Obsidian 记录学习笔记,方便以后查阅
- 番茄工作法:每天 2 个 25 分钟的专注学习时段,比一次学 3 小时更有效
- 源码阅读法:先看项目的 README → 再看 examples → 最后看核心源码
十一、最后的话
AI Agent 不是什么遥不可及的技术,它就是:
给 AI 装上手和脚,让它从"只会说"变成"能干活"。
你现在正站在 AI Agent 爆发的前夜。2026 年,Agent 会像当年的 APP 一样改变世界。而现在,你只需要:
- 今天:看完这篇文章,理解 Agent 的核心概念
- 明天:打开 Coze,搭建你的第一个 Agent
- 下周:写你的第一行 Agent 代码
别光看,动手才是最好的学习方式! 🚀
如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。祝你早日成为 Agent 创造者!🤖✨
更多推荐




所有评论(0)