深度学习

深度学习是以多层神经网络为核心的机器学习方法：让模型自动从海量数据中逐层学习特征表示，在视觉、语言、语音等领域超越人类专家级性能。

什么是深度学习？

深度学习（Deep Learning）的"深度"指网络中隐藏层的数量。

输入层 → 隐藏层1 → 隐藏层2 → ... → 隐藏层N → 输出层
(原始像素)  (边缘)    (纹理)           (语义)    (类别)

与传统机器学习的本质区别：

主题	内容
什么是深度学习	定义、原理、历史沿革、学习范式
激活函数	从 Step 到 SwiGLU 的演进史
损失函数	MSE、MAE、Huber、交叉熵的选择指南
前向与反向传播	完整数学推导，链式法则，梯度流
优化器	SGD → Adam → AdamW 演进全解
正则化与初始化	Xavier/He 初始化，Dropout，BatchNorm，L2

时间	事件
1957	感知机（Perceptron）提出
1986	反向传播算法（Backpropagation）普及
2006	Hinton 提出深度信念网络，深度学习复兴
2012	AlexNet 赢得 ImageNet，深度学习进入实用时代
2014	GAN（生成对抗网络）提出
2015	ResNet（152层）突破梯度消失难题
2017	Transformer 架构提出（"Attention Is All You Need"）
2018	BERT 预训练语言模型革新 NLP
2020	GPT-3（1750亿参数）刷新语言生成上限
2022	ChatGPT 大语言模型走进大众视野
2023+	多模态大模型、扩散模型、AI Agent 时代