学习路径

从零基础到进阶的完整学习指南，帮助你系统掌握AI大模型技术。无论你是刚入门的新手，还是想深入理解原理的开发者，都能找到适合自己的学习路径。

共 3 篇文章·阅读时间：约90分钟

01新手入门路径

这条路径专为零基础学习者设计。我们将从最基础的概念开始，循序渐进地建立AI大模型的知识体系。不要被专业术语吓到，每个人都可以学会。

前置准备

你需要什么

好奇心：对新技术的探索欲望
时间：每天1-2小时的学习时间
耐心：接受学习曲线，不急于求成
电脑：能上网的电脑即可

不需要什么

❌ 高深的数学学位
❌ 计算机专业背景
❌ 昂贵的硬件设备
❌ 编程经验（我们会从头教）

学习路线图

数学基础 → 2. 编程技能 → 3. AI概念 → 4. 实践项目

数学基础

核心知识

不要担心，AI所需的数学比你想象的简单。以下是最核心的内容：

线性代数

理解向量、矩阵、张量的概念。这是AI处理数据的基础。

向量运算（加减、点积）
矩阵乘法
张量的概念

概率统计

理解不确定性和数据分布。

概率基础
常见分布（正态分布等）
期望和方差

微积分基础

理解梯度和优化。

导数的概念
梯度下降

学习资源推荐

3Blue1Brown：数学可视化视频，非常直观
Khan Academy：系统的数学课程
吴恩达的机器学习课程：数学部分讲解清晰

编程技能

为什么选择Python

Python是AI领域最流行的编程语言：

语法简洁，易于学习
丰富的AI库和框架
活跃的社区支持

学习内容

基础语法（1-2周）
- 变量、数据类型
- 条件语句、循环
- 函数定义
数据结构（1周）
- 列表、字典、集合
- 列表推导式
面向对象（1周）
- 类和对象
- 继承和多态
常用库（持续学习）
- NumPy：数值计算
- Pandas：数据处理
- Matplotlib：数据可视化

学习平台推荐

Codecademy：交互式学习
LeetCode：练习编程题
Google Colab：无需安装，在线运行代码

AI基础概念

核心概念

机器学习

让计算机从数据中学习规律，而不是明确编程。

神经网络

模拟人脑结构的计算模型，是深度学习的基础。

深度学习

使用多层神经网络学习复杂模式。

大语言模型

在海量文本上训练的超大规模神经网络。

入门课程推荐

吴恩达机器学习：经典入门课程
Fast.ai：实践导向的深度学习课程
Hugging Face课程：NLP和大模型入门

第一个项目

使用大模型API

最简单的入门方式是使用大模型API：

注册OpenAI或其他平台账号
获取API密钥
用Python调用API
完成一个简单的对话程序

示例：简单的聊天程序

import openai

# 设置API密钥
openai.api_key = "你的API密钥"

# 发送消息
response = openai.ChatCompletion.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "user", "content": "你好，请介绍一下自己"}
    ]
)

print(response.choices[0].message.content)

学习周期

新手入门路径的学习周期约为1-3个月，难度为入门级。完成基础学习后，可以前往进阶学习路径深入学习大模型的原理和应用。

02进阶学习路径

这条路径适合已经掌握Python编程和AI基础概念的学习者。我们将深入探索大模型的核心技术，从Transformer架构到最新应用范式，建立系统的知识框架。

前置要求

Python编程熟练
了解机器学习基本概念
熟悉NumPy、Pandas等库
了解神经网络原理

深入Transformer

核心组件

自注意力机制
- Query、Key、Value的概念
- 注意力权重的计算
- 多头注意力
位置编码
- 为什么需要位置编码
- 正弦余弦编码
- 旋转位置编码（RoPE）
前馈网络
- 两层全连接结构
- 激活函数选择
层归一化
- LayerNorm vs BatchNorm
- Pre-norm vs Post-norm

预训练技术

预训练任务

因果语言模型（CLM）

GPT系列使用，预测下一个token。适合生成任务。

掩码语言模型（MLM）

BERT使用，预测被遮盖的token。适合理解任务。

训练技巧

分布式训练：数据并行、模型并行、ZeRO
混合精度：FP16/BF16训练
梯度累积：扩大有效batch size
学习率调度：预热+余弦衰减

微调方法

参数高效微调（PEFT）

LoRA

低秩适应，只训练插入的低秩矩阵。参数量增加仅0.1%-1%。

QLoRA

量化+LoRA，在单卡上微调65B模型。

Prefix Tuning

在输入前添加可学习的prefix向量。

对齐方法

RLHF：基于人类反馈的强化学习
DPO：直接偏好优化，简化RLHF
Constitutional AI：基于原则的自我改进

提示工程

核心技巧

清晰指令：明确告诉模型要做什么
Few-shot：提供几个示例
Chain-of-Thought：引导模型展示推理过程
角色扮演：设定模型的角色和背景

高级技术

Self-Consistency

多次采样并投票，提高输出可靠性。

Tree of Thoughts

构建思维树，探索多条推理路径。

ReAct

推理+行动，让模型能调用工具。

学习周期

进阶学习路径的学习周期约为3-6个月，难度为进阶级。完成进阶学习后，可以前往实战项目推荐进行更深入的实践。

03实战项目推荐

理论学习需要实践来巩固。这里精选了从入门到高级的实战项目，每个项目都有明确的学习目标、技术栈和实现思路。选择适合自己水平的项目，动手构建真正的AI应用。

入门项目

项目一：命令行对话机器人

最简单的AI应用，学习API调用和对话管理

技术栈：Python + OpenAI API
核心功能：多轮对话、上下文管理、流式输出
预估时间：2-4小时

项目二：智能写作助手

学习Prompt工程和输出处理

技术栈：Python + Streamlit
核心功能：多风格写作、文本改写、语法检查
预估时间：4-8小时

项目三：翻译工具

学习如何处理多语言和专业术语

技术栈：Python + FastAPI
核心功能：多语言翻译、术语表、批量处理
预估时间：4-8小时

进阶项目

项目四：个人知识库问答

RAG技术的经典应用，构建基于私有数据的问答系统

技术栈：LangChain + ChromaDB + Streamlit
核心功能：文档上传、向量化、相似搜索、答案生成

用户上传PDF/TXT文档
文档分块并向量化存储
用户提问，检索相关段落
LLM基于检索结果生成答案

预估时间：1-2周

项目五：领域模型微调

学习LoRA微调，打造专属领域模型

技术栈：LLaMA-Factory + LLaMA 3 / Qwen
核心功能：数据准备、LoRA微调、模型评估

预估时间：1-2周

项目六：智能客服系统

综合应用RAG + 意图识别 + 多轮对话

技术栈：FastAPI + Next.js + LangChain
核心功能：意图识别、知识检索、对话管理、工单创建
预估时间：2-3周

高级项目

项目七：智能助手Agent

让AI自主规划和执行任务，调用工具解决问题

技术栈：LangGraph + LangChain + Python
核心功能：任务规划、工具调用、执行反馈、自我反思

预估时间：2-4周

项目八：AI产品完整应用

从零构建一个完整的AI产品，涵盖前端、后端、AI模型

技术栈：Next.js + FastAPI + PostgreSQL + Redis
核心功能：用户系统、订阅付费、API限流、监控告警

预估时间：1-2个月

开源项目推荐

LLaMA-Factory：一站式微调框架
Dify：LLM应用开发平台
Open WebUI：开源ChatGPT界面
LangChain：LLM应用框架

学习建议

从简单项目开始，逐步增加复杂度
每个项目都要完整实现，不要只看不做
记录遇到的问题和解决方案
尝试改进和扩展项目功能

← 发展历程

AI 历史 →

01新手入门路径

前置准备

你需要什么

不需要什么

学习路线图

数学基础

核心知识

线性代数

概率统计

微积分基础

学习资源推荐

编程技能

为什么选择Python

学习内容

学习平台推荐

AI基础概念

核心概念

机器学习

神经网络

深度学习

大语言模型

入门课程推荐

第一个项目

使用大模型API

示例：简单的聊天程序

学习周期

02进阶学习路径

前置要求

深入Transformer

核心组件

推荐资源

预训练技术

预训练任务

因果语言模型（CLM）

掩码语言模型（MLM）

训练技巧

微调方法

参数高效微调（PEFT）

LoRA

QLoRA

Prefix Tuning

对齐方法

提示工程

核心技巧

高级技术

Self-Consistency

Tree of Thoughts

ReAct

学习周期

03实战项目推荐

入门项目

项目一：命令行对话机器人

项目二：智能写作助手

项目三：翻译工具

进阶项目

项目四：个人知识库问答

项目五：领域模型微调

项目六：智能客服系统

高级项目

项目七：智能助手Agent

项目八：AI产品完整应用

开源项目推荐

学习建议