Skip to content

AI 知识体系总览

什么是人工智能?

人工智能(Artificial Intelligence, AI) 是计算机科学的一个分支,致力于创造能够执行通常需要人类智慧才能完成的任务的系统。

AI 不是一种单一技术,而是一个由多个子领域组成的技术体系:

人工智能 (AI)
├── 机器学习 (Machine Learning)
│   ├── 监督学习(线性回归、SVM、决策树...)
│   ├── 无监督学习(聚类、降维...)
│   └── 强化学习(Q-Learning、PPO...)
├── 深度学习 (Deep Learning)
│   ├── 神经网络基础(FNN、CNN)
│   ├── 序列模型(RNN、LSTM、GRU)
│   └── Transformer 架构
└── 自然语言处理 (NLP)
    ├── 文本表示(Word2Vec、GloVe)
    ├── 预训练模型(BERT、GPT)
    └── 大语言模型(LLM)

知识体系结构

本知识库按照从基础到进阶的逻辑顺序组织,共分为以下几个部分:

🧮 第一篇:数学基础

AI 的根基是数学。掌握以下数学知识是理解所有算法的必要条件:

模块核心内容
线性代数向量、矩阵、范数、特征值分解
微积分与优化导数、梯度、链式法则、泰勒展开
向量化计算NumPy 矩阵运算加速技巧
归一化与标准化Min-Max 归一化、Z-Score 标准化

🤖 第二篇:机器学习

从传统机器学习算法入手,理解 AI 的基本工作方式:

模块核心内容
ML 概述监督/无监督/强化学习范式
特征工程特征选择、变换、降维
模型评估损失函数、正则化、过拟合
评估指标准确率、精确率、召回率、F1、AUC

📊 第三篇:监督学习算法

算法适用场景
线性回归连续值预测
逻辑回归二分类问题
K 近邻 (KNN)小数据集分类/回归
决策树可解释性分类
支持向量机 (SVM)高维小样本分类
朴素贝叶斯文本分类
感知机线性可分问题

🌲 第四篇:集成学习

算法适用场景
集成学习概述Bagging vs Boosting vs Stacking
随机森林通用分类/回归
梯度提升 GBDT高精度预测
AdaBoost自适应提升
XGBoost竞赛神器,表格数据
LightGBM高效大数据处理

🔵 第五篇:无监督学习

模块核心内容
聚类算法K-Means、层次聚类、DBSCAN
降维技术PCA、t-SNE、UMAP

🧠 第六篇:深度学习基础

模块核心内容
深度学习介绍什么是深度学习,与 ML 的区别
激活函数Sigmoid、ReLU、Softmax 的演进史
损失函数MSE、交叉熵、对比损失
前向/反向传播链式法则,计算图
优化器SGD → Adam → AdamW
参数初始化与正则化Dropout、BatchNorm、权重衰减

🏗️ 第七篇:神经网络架构

架构核心内容
前馈神经网络 FNN多层感知机基础
循环神经网络 RNN序列建模,时间步
长短期记忆 LSTM门控机制,长距离依赖
门控循环单元 GRULSTM 的轻量版
Seq2Seq编码器-解码器框架

⚡ 第八篇:Attention 与 Transformer

模块核心内容
注意力机制Q/K/V,加权求和,可视化
Transformer 架构编码器-解码器,完整数据流
自注意力与多头注意力并行化的全局感知
位置编码为什么 Transformer 需要位置信息

📝 第九篇:NLP 基础

模块核心内容
NLP 导论NLP 定义、任务和挑战
NLP 发展史规则 → 统计 → 深度学习 → 大模型
文本预处理分词、子词、词表构建
文本表示Word2Vec、GloVe、FastText

🌟 第十篇:预训练语言模型

模型核心内容
GPT 系列自回归语言模型,解码器架构
BERT双向编码,Masked LM
BERT 变体RoBERTa、ALBERT、DistilBERT

🚀 第十一篇:现代 AI 与大语言模型

模块核心内容
大语言模型 (LLM)GPT-4、LLaMA、Claude 的技术原理
提示工程CoT、Few-shot、提示设计最佳实践
对齐技术RLHF、DPO、Constitutional AI

🛠️ 第十二篇:工程实践

模块核心内容
HuggingFace 生态Transformers、Datasets、Tokenizers
模型微调LoRA、QLoRA、全量微调
模型部署vLLM、ONNX、量化、推理优化

学习路径建议

🎯 路径一:AI 入门(无基础)

数学基础 → 机器学习概述 → 线性回归 → 逻辑回归 → 决策树 → 
集成学习 → 深度学习基础 → Transformer → 大语言模型

预计时间: 3-6 个月

🎯 路径二:深度学习工程师

数学基础(快速回顾)→ 深度学习基础 → 神经网络架构 → 
Transformer → 预训练模型 → 微调 → 工程部署

预计时间: 2-4 个月

🎯 路径三:NLP 专项

文本预处理 → 文本表示 → 序列模型 → Attention → Transformer → 
BERT/GPT → 大语言模型 → 提示工程

预计时间: 2-3 个月


💡 学习建议: 每个章节都包含理论讲解、数学推导和代码实现。建议在阅读理论后,动手实现代码,加深理解。

最后更新于:

AI 知识体系 — 从机器学习到大语言模型