AI Agent 从零到精通:小白如何一步步学会使用和创造 AI Agent?

写在前面:2026 年,AI Agent 已经不是什么高深概念了——它就是能替你干活的 AI 员工。但网上教程要么太专业看不懂,要么太浅尝辄止。这篇文章专为零基础小白设计,用最通俗的语言,带你从"啥是 Agent"到"我能造 Agent"。

全文约 12000 字,建议收藏后分阶段阅读。


零、先回答一个问题:为什么要学 Agent?

你可能觉得:ChatGPT 也能聊天,为什么还要学 Agent?

举个例子你就懂了:

场景 普通聊天机器人 AI Agent
"帮我查一下明天北京天气" "我无法联网,建议你打开天气APP查看" 自动调用天气API → 告诉你"明天北京28°C,晴"
"帮我总结这份PDF" "请把内容复制粘贴给我" 自己读取文件 → 自动总结 → 还能回答追问
"帮我监控竞品价格" "这超出了我的能力范围" 定时抓取网页 → 发现降价自动发微信通知你

一句话总结

普通 AI 是"只会说的军师",Agent 是"能说又能干的将军"。

学会了 Agent,你就能让 AI 真正替你工作,而不只是陪你聊天。


一、什么是 AI Agent?(5 分钟搞懂核心概念)

1.1 用一个故事理解 Agent

想象你开了一家公司,招了一个员工叫"小智":

  1. 你下达任务:"帮我调研一下 Agent 框架的市场情况"
  2. 小智思考(Thought):"我需要先搜索相关信息"
  3. 小智行动(Action):打开浏览器搜索
  4. 小智观察(Observation):看到了几篇有用的文章
  5. 小智再思考:"我需要更详细的数据,去 GitHub 看看"
  6. 小智再行动:访问 GitHub,收集 Star 数、更新频率
  7. 小智再观察:"数据够了,可以总结了"
  8. 小智输出报告:给你一份完整的调研结果

这就是一个 Agent 的工作方式 —— 也就是大名鼎鼎的 ReAct 循环(Reasoning + Acting)。

1.2 Agent 的四个核心部件

把 Agent 想象成一个打工人,它需要四样东西:

┌──────────────────────────────────────┐
│              AI Agent                 │
│                                      │
│  🧠 大脑(LLM):负责理解和思考       │
│     → 就像 GPT-4、Claude、通义千问    │
│                                      │
│  🛠 工具(Tools):手和脚             │
│     → 搜索、发邮件、读文件、写代码    │
│                                      │
│  📝 记忆(Memory):记事本            │
│     → 记住之前的对话和经验            │
│                                      │
│  📋 规划(Planning):工作计划        │
│     → 把大任务拆成小步骤              │
│                                      │
└──────────────────────────────────────┘
部件 通俗解释 类比
LLM(大脑) 大语言模型,负责理解、推理、生成文本 一个超级聪明的人
Tools(工具) Agent 可以调用的外部能力:搜索、计算器、API 给聪明人装上"手和脚"
Memory(记忆) 短期记忆(对话上下文)+ 长期记忆(历史经验) 打工人的笔记本
Planning(规划) 把复杂任务拆成可执行的步骤 打工人的工作计划表

1.3 Agent 和普通 AI 聊天的本质区别

普通聊天 AI:
  用户提问 → AI 回答 → 结束

AI Agent:
  用户提问 → AI 思考 → 调用工具 → 观察结果 → 继续思考
          → 可能再调用另一个工具 → 观察结果 → ... → 给出最终答案

关键区别:Agent 有一个循环,它能多步思考和行动,直到任务完成。


二、当前 Agent 生态全景(你知道有哪些 Agent 吗?)

2.1 Agent 框架(开发者造 Agent 的工具)

框架 谁做的 Stars 特点 适合阶段
LangChain 社区 100k+ 生态最大,工具最多 🟡 使用阶段
LangGraph LangChain 团队 10k+ 流程图式编排,控制力强 🟠 原理阶段
smolagents HuggingFace 12k+ 极简,代码少,适合读源码 🟠 原理阶段
CrewAI 社区 25k+ 多 Agent 协作,代码易懂 🔴 创造阶段
AutoGen 微软 40k+ 多 Agent 对话协作 🔴 创造阶段
Hermes Agent NousResearch 新秀 自我进化、学习闭环 🔴 参考学习

2.2 Agent 产品(直接用的,不用写代码)

产品 做什么 是否免费
ChatGPT + GPTs 创建自己的定制 GPT Plus 付费
Coze(扣子) 拖拽式搭建 Agent 免费
Dify 开源 Agent 平台 免费开源
FastGPT 知识库 Agent 免费开源
** Manus ** 通用 AI Agent,自动完成任务 邀请制

2.3 Agent 的应用场景

🎯 编程助手    → 自动写代码、Debug、代码审查
📊 数据分析    → 自动处理 Excel、生成报表
🔍 信息搜索    → 自动搜索、整理、总结信息
📧 办公自动化  → 自动处理邮件、文档、日程
🛒 电商运营    → 自动选品、写文案、监控竞品
🎮 游戏NPC     → 智能对话、自主决策
📱 个人助手    → 日程管理、信息提醒、学习辅导

三、阶段一:搞懂 Agent 概念(1-2 周)

目标:理解 Agent 的核心概念,能和别人聊 Agent 不露怯

3.1 必学的 6 个概念

我按"理解顺序"排列,每个概念都依赖上一个:

① LLM(大语言模型)— Agent 的大脑

什么是 LLM?
- 就是 ChatGPT、Claude、通义千问背后的技术
- 它能理解文字、生成文字、推理逻辑
- 但它只能"想",不能"做"

类比:一个超级聪明但被困在房间里的人

② Prompt(提示词)— 你怎么指挥 Agent

什么是 Prompt?
- 就是你发给 AI 的指令
- 好的 Prompt = 清晰的任务描述 + 约束条件 + 输出格式

例子:
❌ 差的 Prompt:"帮我分析一下市场"
✅ 好的 Prompt:"请分析 2026 年 AI Agent 市场的三个趋势,
   每个趋势给出一个具体的公司案例,用表格呈现"

③ Function Calling(函数调用)— Agent 的手

什么是 Function Calling?
- 让 LLM 能够"调用外部工具"
- LLM 不直接执行,而是告诉你"我想调什么工具,传什么参数"
- 你的代码执行后,把结果喂回给 LLM

流程:
你 → LLM:"明天北京天气?"
LLM → 你:"我想调用 get_weather(city='北京')"
你 → 执行API → 结果:"28°C,晴"
你 → LLM:"工具返回了28°C,晴"
LLM → 你:"明天北京28°C,晴天,适合出门"

④ ReAct 循环 — Agent 的核心工作方式

ReAct = Reasoning(推理)+ Acting(行动)

循环过程:
Thought(思考)→ Action(行动)→ Observation(观察)→ Thought → Action → ... → 最终答案

这就是 Agent 能"多步完成任务"的秘密!

⑤ RAG(检索增强生成)— Agent 的参考书

什么是 RAG?
- Retrieval-Augmented Generation(检索增强生成)
- 简单说:先从知识库里找到相关内容,再让 AI 基于这些内容回答

类比:
- 不用 RAG = 让你闭卷考试
- 用了 RAG = 让你开卷考试,还能精准翻到对应页

⑥ Memory(记忆)— Agent 的笔记本

Agent 的记忆分两种:

短期记忆:记住当前对话的上下文
  → "刚才你说了要查天气,我已经查到了..."

长期记忆:记住历史经验和用户偏好
  → "你之前说过你住在北京,所以默认查北京天气"

3.2 推荐学习资源

资源 类型 链接/方式
B站搜"AI Agent 通俗讲解" 视频 选播放量 >10 万的
吴恩达 AI Agent 课程 免费课 deeplearning.ai
Lilian Weng 博客 文章 lilianweng.github.io
直接问 ChatGPT/豆包 对话 "用小白能懂的话解释什么是 AI Agent"

3.3 阶段一检验

✅ 能回答以下问题就算过关:
1. Agent 和普通聊天机器人有什么区别?
2. 为什么 Agent 需要 Function Calling?
3. ReAct 循环是什么?为什么它很重要?
4. RAG 解决了什么问题?


四、阶段二:熟练使用 Agent(2-3 周)

目标:能用 Agent 产品和框架完成实际工作

4.1 如果你不会 Python(花 1 周速成)

只需学这些就够了:

# 1. 变量(存东西)
name = "小明"
age = 25

# 2. 列表(存一组东西)
tools = ["搜索", "计算器", "翻译"]
print(tools[0])  # 输出:搜索

# 3. 字典(存带标签的东西)
config = {"model": "gpt-4", "temperature": 0.7}
print(config["model"])  # 输出:gpt-4

# 4. if/else(做判断)
if age >= 18:
    print("成年人")

# 5. for 循环(重复做事)
for tool in tools:
    print(f"可用工具:{tool}")

# 6. 函数(封装一段逻辑)
def ask_agent(question):
    # 调用 API 的代码
    return "Agent 的回答"

# 7. 安装第三方包(在终端执行)
# pip install openai langchain

不需要学的(现阶段):类、装饰器、异步、多线程、设计模式。

4.2 Level 1:零代码搭建 Agent(体验,1 天)

方案 A:用 Coze(扣子)搭建你的第一个 Agent
步骤:
1. 打开 coze.cn,用手机号注册
2. 点击"创建 Bot"
3. 写提示词:"你是一个 AI 学习顾问,帮助用户学习 AI Agent"
4. 添加插件:搜索、网页读取
5. 配置知识库:上传几篇 AI Agent 教程的 PDF
6. 点"发布" → 在聊天窗口测试

全程不需要写一行代码!
方案 B:用 Dify 搭建工作流 Agent
步骤:
1. 打开 dify.ai,注册
2. 选择"创建空白应用" → 选"Agent"
3. 配置 LLM(选 GPT-4 或国产模型)
4. 添加工具(搜索、天气、计算器等)
5. 在画布上拖拽连接,设计 Agent 的工作流
6. 测试并发布

Dify 是开源的,也可以本地部署!

4.3 Level 2:写代码使用 Agent 框架(2 周)

第一个代码 Agent(30 行代码搞定)
"""
你的第一个 AI Agent!
功能:一个能搜索 + 计算的智能助手
"""

from openai import OpenAI

client = OpenAI(api_key="your-api-key")

# 定义 Agent 可以使用的工具
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "查询指定城市的天气",
            "parameters": {
                "type": "object",
                "properties": {
                    "city": {"type": "string", "description": "城市名"}
                },
                "required": ["city"]
            }
        }
    }
]

# 模拟天气工具的执行
def get_weather(city):
    # 实际项目中这里会调用真实的天气 API
    weather_data = {
        "北京": "28°C,晴天",
        "上海": "25°C,多云",
        "深圳": "32°C,雷阵雨"
    }
    return weather_data.get(city, f"{city}:数据暂无")

# Agent 主循环
messages = [{"role": "user", "content": "北京和上海明天天气怎么样?哪个更适合出门?"}]

# 第一轮:发送给 LLM
response = client.chat.completions.create(
    model="gpt-4",
    messages=messages,
    tools=tools
)

message = response.choices[0].message
print(f"🤖 Agent 思考:{message}")

# 如果 Agent 决定调用工具
if message.tool_calls:
    for tool_call in message.tool_calls:
        if tool_call.function.name == "get_weather":
            import json
            args = json.loads(tool_call.function.arguments)
            result = get_weather(args["city"])
            print(f"🛠 执行工具:查询{args['city']}天气 → {result}")

            # 把工具结果喂回给 LLM
            messages.append(message)
            messages.append({
                "role": "tool",
                "tool_call_id": tool_call.id,
                "content": result
            })

    # 第二轮:LLM 基于工具结果生成最终回答
    final_response = client.chat.completions.create(
        model="gpt-4",
        messages=messages,
        tools=tools
    )
    print(f"\n💬 最终回答:{final_response.choices[0].message.content}")

# 输出示例:
# 🤖 Agent 思考:需要调用两次天气查询
# 🛠 执行工具:查询北京天气 → 28°C,晴天
# 🛠 执行工具:查询上海天气 → 25°C,多云
# 💬 最终回答:北京28°C晴天更适合出门,上海多云也可以但温度稍低。

看到没?这就是 Agent 的核心循环:思考 → 调工具 → 观察结果 → 再思考 → 最终回答

4.4 阶段二检验

✅ 能完成以下任务就算过关:
1. 在 Coze/Dify 上搭建一个有工具、有知识库的 Agent
2. 用 Python + OpenAI API 写一个能调用工具的 Agent
3. 理解 Function Calling 的完整流程


五、阶段三:理解 Agent 原理(3-4 周)

目标:看懂 Agent 框架源码,能手写一个简易 Agent

5.1 Agent 的完整工作流程

用户输入
   ↓
┌─────────────────────────────────┐
│         Agent 主循环             │
│                                 │
│  1. 把用户消息 + 工具列表发给 LLM │
│  2. LLM 决定:                   │
│     a. 直接回答 → 返回给用户     │
│     b. 调用工具 → 执行工具        │
│        → 把结果喂回 LLM          │
│        → 回到步骤 1              │
│  3. 循环直到 LLM 给出最终回答    │
│                                 │
└─────────────────────────────────┘
   ↓
返回结果给用户

5.2 手写一个最简 Agent(不用任何框架)

"""
手写一个最简 Agent,不用 LangChain 等框架
帮助你理解 Agent 的本质
"""
import json
from openai import OpenAI

client = OpenAI(api_key="your-api-key")

class SimpleAgent:
    def __init__(self):
        self.tools = {}       # 注册的工具
        self.messages = []    # 对话历史(短期记忆)

    def register_tool(self, name, func, description, parameters):
        """注册一个工具"""
        self.tools[name] = {
            "func": func,
            "schema": {
                "type": "function",
                "function": {
                    "name": name,
                    "description": description,
                    "parameters": parameters
                }
            }
        }

    def run(self, user_input, max_steps=5):
        """运行 Agent 主循环"""
        self.messages.append({"role": "user", "content": user_input})

        tool_schemas = [t["schema"] for t in self.tools.values()]

        for step in range(max_steps):
            print(f"\n--- 第 {step + 1} 步 ---")

            # 1. 让 LLM 思考
            response = client.chat.completions.create(
                model="gpt-4",
                messages=self.messages,
                tools=tool_schemas if tool_schemas else None
            )

            msg = response.choices[0].message
            self.messages.append(msg)

            # 2. 检查是否需要调工具
            if not msg.tool_calls:
                # 不需要调工具,直接返回
                print(f"💬 最终回答:{msg.content}")
                return msg.content

            # 3. 执行所有工具调用
            for tool_call in msg.tool_calls:
                tool_name = tool_call.function.name
                tool_args = json.loads(tool_call.function.arguments)

                print(f"🛠 调用工具:{tool_name}({tool_args})")

                # 执行工具
                if tool_name in self.tools:
                    result = self.tools[tool_name]["func"](**tool_args)
                    print(f"📊 工具返回:{result}")
                else:
                    result = f"错误:未知工具 {tool_name}"

                # 把结果喂回
                self.messages.append({
                    "role": "tool",
                    "tool_call_id": tool_call.id,
                    "content": str(result)
                })

        return "达到最大步数限制,任务未完成。"


# ===== 使用示例 =====
agent = SimpleAgent()

# 注册工具
def calculate(expression):
    """安全计算数学表达式"""
    try:
        return str(eval(expression))  # 生产环境请用更安全的方式
    except:
        return "计算错误"

def search_web(query):
    """模拟网页搜索"""
    fake_results = {
        "Python": "Python 是最流行的编程语言之一,适合 AI 开发",
        "Agent": "AI Agent 是能自主执行任务的智能体",
    }
    for key in fake_results:
        if key.lower() in query.lower():
            return fake_results[key]
    return f"搜索'{query}':暂无结果"

agent.register_tool(
    "calculate", calculate,
    "计算数学表达式",
    {"type": "object", "properties": {"expression": {"type": "string"}}, "required": ["expression"]}
)
agent.register_tool(
    "search", search_web,
    "搜索互联网信息",
    {"type": "object", "properties": {"query": {"type": "string"}}, "required": ["query"]}
)

# 测试!
agent.run("帮我搜索一下什么是AI Agent,然后算一下 2026 * 3 等于多少")

5.3 读源码的建议顺序

第一步:读 smolagents(代码最少,最容易懂)

pip install smolagents

重点看:
- src/smolagents/agents.py — Agent 主循环
- src/smolagents/tools.py — 工具定义方式
- src/smolagents/models.py — 怎么调 LLM

第二步:用 LangChain 做项目

# LangChain 版本的简单 Agent
from langchain.agents import create_openai_tools_agent, AgentExecutor
from langchain.tools import tool
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate

# 定义工具
@tool
def search_web(query: str) -> str:
    """搜索互联网信息"""
    return f"搜索结果:{query} 的相关信息..."

@tool  
def calculate(expression: str) -> str:
    """计算数学表达式"""
    return str(eval(expression))

# 创建 Agent
llm = ChatOpenAI(model="gpt-4")
tools = [search_web, calculate]
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一个有用的AI助手,可以使用工具帮助用户。"),
    ("human", "{input}"),
    ("placeholder", "{agent_scratchpad}"),
])

agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 运行
result = agent_executor.invoke({"input": "搜索AI Agent并计算100*25"})
print(result["output"])

5.4 阶段三检验

✅ 能完成以下任务就算过关:
1. 不用任何框架,纯 Python 手写一个能调工具的 Agent
2. 能看懂 smolagents 的核心源码
3. 能用 LangChain 搭建一个有 2+ 工具的 Agent


六、阶段四:独立创造 Agent 系统(持续精进)

目标:能根据实际需求设计和开发完整的 Agent 系统

6.1 实战项目路线

🟢 项目 1:个人知识库助手(入门级,1-2 周)

功能:
  - 上传文档(PDF/Word/TXT)
  - 自动分块 + 向量化
  - 用户提问 → 自动检索相关内容 → 生成回答

技术栈:
  - LangChain / LlamaIndex
  - ChromaDB(向量数据库)
  - OpenAI Embeddings + GPT-4
  - Gradio / Streamlit(界面)

学到什么:
  ✅ RAG 的完整实现
  ✅ 向量数据库的使用
  ✅ 文档分块和检索策略

🟡 项目 2:自动化工作流 Agent(进阶级,2-3 周)

功能:
  - 定时监控指定网页/数据源
  - 自动分析变化
  - 执行相应操作(发通知/生成报告)
  - 记录历史数据

技术栈:
  - LangGraph(工作流编排)
  - 多个 Tool(网页抓取、邮件发送、数据库操作)
  - 定时任务(APScheduler)

学到什么:
  ✅ 复杂工作流设计
  ✅ 多工具协作
  ✅ Agent 的定时调度

🔴 项目 3:多 Agent 协作系统(高级,3-4 周)

功能:
  - 多个 Agent 扮演不同角色
  - Agent 之间能对话和协作
  - 自动分配任务、汇总结果

示例:AI 开发团队
  - 产品经理 Agent:分析需求
  - 程序员 Agent:写代码
  - 测试员 Agent:测试代码
  - 评审员 Agent:代码审查

技术栈:
  - CrewAI / AutoGen
  - 自定义 Agent 角色和工具
  - Agent 间通信协议

学到什么:
  ✅ 多 Agent 系统设计
  ✅ 角色定义和任务分配
  ✅ Agent 间通信和协调

6.2 Agent 设计的 5 个原则

不管做什么 Agent,记住这 5 条:

原则 1:工具要单一职责

✅ 好的工具:search_web(query)、send_email(to, subject, body)
❌ 坏的工具:do_everything(action, params)

原则 2:Prompt 要清晰具体

✅ 好的 System Prompt:
"你是一个数据分析 Agent。
可用工具:search、calculate、read_csv、plot_chart。
工作方式:先收集数据,再分析,最后可视化。
回答语言:中文。
如果不确定,先调用工具确认,不要猜测。"

❌ 坏的 System Prompt:"你是一个助手"

原则 3:记忆要分层

短期记忆:当前对话(最近 10 轮)
中期记忆:今天的工作上下文
长期记忆:用户偏好、历史经验

原则 4:要有兜底机制

- 设置最大步数(防止死循环)
- 工具调用失败时要有备用方案
- 输出要有格式校验
- 关键操作要人工确认

原则 5:从简单开始,逐步迭代

第一版:1 个工具,能跑通
第二版:加 2-3 个工具
第三版:加记忆
第四版:加错误处理
第五版:加用户界面

七、保持学习:如何跟上 Agent 领域的发展

7.1 每日信息源(每天 15 分钟)

渠道 看什么 链接
Twitter/X AI 研究者实时动态 关注 @AndrewYNg @kaborabot @swyx
机器之心 中文 AI 资讯 ji!qizhixin.com
Hugging Face 开源模型和项目 huggingface.co
GitHub Trending 最火的 AI 项目 github.com/trending

7.2 每周学习计划

任务 时间 具体做法
看 1 篇 Agent 论文 1 小时 ArXiv 搜 "agent",读摘要 + 结论
跑 1 个 GitHub 项目 2 小时 clone 下来跑通,改改参数
写 1 段 Agent 代码 2 小时 哪怕只加一个新工具也行

7.3 推荐关注的 GitHub 仓库

仓库 为什么关注
langchain-ai/langchain Agent 框架标杆,更新最活跃
huggingface/smolagents 极简 Agent,学原理首选
crewAIInc/crewAI 多 Agent 协作,代码易懂
microsoft/autogen 微软出品,多 Agent 对话
NousResearch/hermes-agent 自我进化的 Agent,前沿方向
e2b-dev/awesome-ai-agents AI Agent 资源大全

八、常见问题 FAQ

Q1:学 Agent 一定要会 Python 吗?

初期不一定!你可以先用 Coze/Dify 零代码体验。但想深入和创造,Python 是必须的。好消息是 Agent 方向需要的 Python 知识不多,1 周就能速成。

Q2:用哪个 LLM 做 Agent 最好?

  • 预算充足:GPT-4(Function Calling 最稳)
  • 性价比高:Claude 3.5 Sonnet
  • 国产免费:通义千问 / DeepSeek
  • 本地部署:LLaMA 3 / Qwen2

Q3:Agent 和 Workflow 有什么区别?

  • Workflow:固定流程,A→B→C,每步都预设好
  • Agent:动态决策,AI 自己决定走哪步
  • 实际项目中经常混用:主干用 Workflow,分支用 Agent

Q4:学 Agent 需要学机器学习/深度学习吗?

不需要!Agent 是"应用层",你只需要会用 LLM 的 API,不需要理解模型训练。就像你会开车不需要会造发动机。

Q5:Agent 的安全风险怎么控制?

  • 永远设置最大步数限制
  • 危险操作(删除、转账)要人工确认
  • 用沙箱环境运行代码
  • 记录 Agent 的每一步操作日志

Q6:多久能从零到独立造 Agent?

按每天 2 小时学习计算:
- 能用 Agent:2-3 周
- 能看懂原理:1-2 个月
- 能独立创造:2-3 个月
- 能做出生产级项目:3-6 个月


九、学习路线总结

第 1-2 周 🟢 搞懂概念
  └─ 看 3 个讲解视频 + 理解 ReAct 循环

第 3-5 周 🟡 熟练使用
  └─ Coze 搭建 Agent + 学 Python + 写代码调 API

第 6-9 周 🟠 理解原理
  └─ 手写 Agent + 读 smolagents 源码 + LangChain 实战

第 10 周+ 🔴 独立创造
  └─ 做 3 个实战项目(知识库→工作流→多Agent)

十、学习资料汇总(宝藏资源一网打尽)

这是我精心整理的 Agent 学习资料大全,按类型分类,每个都标注了难度和推荐理由。建议收藏本文,随时查阅!

10.1 📚 必读书籍

书名 难度 推荐理由
《Build a Large Language Model (From Scratch)》 — Sebastian Raschka ⭐⭐⭐ 从零手把手教你训练一个 LLM,理解底层原理
《AI Agents in Action》 — Micheal Lanham ⭐⭐ 专门讲 Agent 开发的实战书,涵盖多种框架
《LLM Engineer's Handbook》 — Paul Iusztin ⭐⭐⭐ LLM 工程化最佳实践,包含 RAG、Agent、部署
《Designing Machine Learning Systems》 — Chip Huyen ⭐⭐ ML 系统设计思维,帮你理解 Agent 在系统中的定位
《Deep Learning》 — Ian Goodfellow ⭐⭐⭐⭐ 深度学习圣经,想深入 AI 底层再看(可选)

💡 小白建议:先看第 2 本《AI Agents in Action》,直接上手 Agent 开发。

10.2 🎓 免费课程

课程 平台 时长 难度 链接
AI Agents in LangGraph DeepLearning.AI 4 小时 ⭐⭐ deeplearning.ai
Multi AI Agent Systems with CrewAI DeepLearning.AI 3 小时 ⭐⭐ deeplearning.ai
Building Agentic RAG with LlamaIndex DeepLearning.AI 2 小时 ⭐⭐ deeplearning.ai
Functions, Tools and Agents with LangChain DeepLearning.AI 3 小时 ⭐⭐ deeplearning.ai
ChatGPT Prompt Engineering for Developers DeepLearning.AI 1 小时 deeplearning.ai
CS50's Introduction to AI with Python edX 12 周 ⭐⭐⭐ cs50.harvard.edu
LangChain 官方教程 LangChain Docs 自定进度 ⭐⭐ python.langchain.com/docs
HuggingFace NLP Course HuggingFace 3 天 ⭐⭐ huggingface.co/learn

💡 小白建议:先看 Prompt Engineering(1小时),再看 Functions/Tools/LangChain(3小时),最后看 Agents in LangGraph(4小时)。总计约 8 小时入门。

10.3 📺 YouTube / B站 频道

YouTube(英文,质量最高)
频道 内容风格 推荐视频
LangChain 官方教程,最权威 "LangChain Agents Explained" 系列
Nicholas Renotte 手把手实战,超级详细 "Build AI Agent from Scratch"
Dave Ebbelaar Agent 开发实战,贴近实际 "How to Build AI Agents" 系列
Tech With Tim Python + AI,适合入门 "AI Agent Tutorial"
Sam Witteveen Google DevExpert,深入浅出 "LangChain Agents Deep Dive"
Andrej Karpathy 前 OpenAI 联合创始人 "Let's build GPT" 系列
3Blue1Brown 可视化讲解 AI 原理 "Neural Networks" 系列
Yannic Kilcher 论文解读,前沿动态 每周论文速递
B站(中文,更友好)
UP主 内容风格 搜索关键词
李沐(动手学深度学习) 学术大佬,讲得通俗易懂 "AI Agent 通俗讲解"
同济子豪兄 实战教程,代码详尽 "LangChain Agent 教程"
跟李沐学AI 论文解读 + 代码实现 "Agent 论文精读"
技术蛋老师 短视频,快速了解概念 "什么是 AI Agent"
AI garlic AI 新闻 + 技术解读 "Agent 最新进展"

10.4 📖 必读文章 / 博客

经典文章(按阅读顺序排列)
文章 作者 为什么必读
LLM Powered Autonomous Agents Lilian Weng (OpenAI) Agent 领域的圣经,最全面的 Agent 综述
ReAct: Synergizing Reasoning and Acting in Language Models Yao et al. ReAct 模式的原始论文,理解 Agent 核心循环
Toolformer Schick et al. AI 自动学习使用工具的里程碑论文
Generative Agents: Interactive Simulacra Stanford 斯坦福"AI 小镇"论文,多 Agent 社交模拟
A Survey on Large Language Model based Autonomous Agents Fudan University Agent 领域最全面的学术综述
优质博客 / 网站
网站 特色 链接
Lilian Weng's Blog OpenAI 研究员,文章质量极高 lilianweng.github.io
LangChain Blog 框架官方,最新特性介绍 blog.langchain.dev
The Batch (Andrew Ng) 吴恩达的 AI 周报 deeplearning.ai/the-batch
Simon Willison's Weblog Django 创始人,AI 工具深度体验 simonwillison.net
Interconnects Nathan Lambert,AI 前沿分析 interconnects.ai
Ahead of AI Sebastian Raschka,ML 研究 + 实战 mag.sebastianraschka.com

10.5 🛠 实战项目推荐(从易到难)

项目 难度 学到什么 GitHub 链接
简易聊天机器人 API 调用基础 自己手写
RAG 知识库问答 ⭐⭐ 文档处理 + 向量检索 github.com/langchain-ai/langchain
AI 搜索引擎 ⭐⭐ 搜索 + 总结 + 引用 github.com/langchain-ai
Auto-coder(自动写代码) ⭐⭐⭐ 代码生成 + 执行 + 调试 github.com/significant-gravitas/AutoGPT
AI 客服系统 ⭐⭐⭐ 多轮对话 + 意图识别 + 工具调用 自己搭建
多 Agent 协作开发 ⭐⭐⭐⭐ Agent 间通信 + 任务分配 github.com/crewAIInc/crewAI
AI 操作系统(Computer Use) ⭐⭐⭐⭐⭐ 屏幕理解 + 自动操作 github.com/All-Hands-AI/OpenHands

10.6 📰 每日资讯获取渠道

渠道 更新频率 特色 链接/方式
机器之心 每日 国内最专业的 AI 媒体 ji!qizhixin.com
量子位 每日 AI 资讯 + 深度分析 qbitai.com
新智元 每日 AI 产业报道 zhidx.com/ai
Twitter/X AI 圈 实时 研究者第一手动态 关注 @AndrewYNg @swyx @kaborabot
Reddit r/MachineLearning 每日 学术 + 产业讨论 reddit.com/r/MachineLearning
Reddit r/LocalLLaMA 每日 本地模型 + 开源动态 reddit.com/r/LocalLLaMA
Hugging Face Daily 每日 开源模型和项目 huggingface.co/papers
AI News Newsletter 每周 一周 AI 大事汇总 订阅:theainewsletter.com
TLDR AI 每日 5 分钟读完 AI 日报 订阅:tldrnewsletter.com

10.7 🧰 开发工具和平台

工具 用途 是否免费
Jupyter Notebook 边写代码边实验,学 Agent 最佳环境 ✅ 免费
Google Colab 免费云端 GPU,跑模型不用本地配置 ✅ 免费
Cursor / Windsurf AI 辅助编程 IDE,写 Agent 代码效率翻倍 基础免费
Docker 隔离环境部署 Agent,避免依赖冲突 ✅ 免费
Streamlit 快速给 Agent 做个 Web 界面 ✅ 免费
Gradio 另一个快速做 AI 界面的工具 ✅ 免费
Postman 测试 API 接口,调试 Agent 工具 基础免费
HuggingFace Spaces 免费部署和分享你的 Agent 项目 ✅ 免费

10.8 🗺️ 学习路径速查表

小白入门路径(按顺序学,每个 1-2 天):

Day 1-2   📺 B站看 2-3 个 "AI Agent 通俗讲解" 视频
Day 3-4   📖 读 Lilian Weng 的 "LLM Powered Autonomous Agents"
Day 5-7   🎓 吴恩达 Prompt Engineering 课程(1小时)
Day 8-10  🎓 吴恩达 Functions/Tools/Agents 课程(3小时)
Day 11-14 🛠 用 Coze/Dify 搭建第一个 Agent(零代码)
Day 15-17 🎓 吴恩达 AI Agents in LangGraph 课程(4小时)
Day 18-21 💻 写第一个 Python Agent 代码(参考本文第四章)
Day 22-28 🛠 做项目:个人知识库 Agent(RAG)
Day 29-35 💻 读 smolagents 源码,理解原理
Day 36-42 🛠 做项目:自动化工作流 Agent
Day 43-56 🛠 做项目:多 Agent 协作系统

10.9 💡 高效学习小技巧

  1. 费曼学习法:学完一个概念,试着用大白话给别人讲一遍。讲不清楚 = 没学透
  2. 项目驱动:别光看教程,每学一个知识点就用到项目里
  3. 善用 AI 学 AI:遇到不懂的,直接问 ChatGPT "用小白能懂的话解释 xxx"
  4. 加入社区:LangChain Discord、HuggingFace Discord,和同路人交流
  5. 记笔记:用 Notion/Obsidian 记录学习笔记,方便以后查阅
  6. 番茄工作法:每天 2 个 25 分钟的专注学习时段,比一次学 3 小时更有效
  7. 源码阅读法:先看项目的 README → 再看 examples → 最后看核心源码

十一、最后的话

AI Agent 不是什么遥不可及的技术,它就是:

给 AI 装上手和脚,让它从"只会说"变成"能干活"。

你现在正站在 AI Agent 爆发的前夜。2026 年,Agent 会像当年的 APP 一样改变世界。而现在,你只需要:

  1. 今天:看完这篇文章,理解 Agent 的核心概念
  2. 明天:打开 Coze,搭建你的第一个 Agent
  3. 下周:写你的第一行 Agent 代码

别光看,动手才是最好的学习方式! 🚀


如果这篇文章对你有帮助,请点赞 + 收藏 + 关注三连!🙏
有任何问题欢迎在评论区留言,我会一一回复。

祝你早日成为 Agent 创造者!🤖✨

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐