Skip to content

从零实现两层神经网络手写数字识别

写给完全零基础新手的深度学习入门小册子 · 纯 numpy 实现 · 公式全部手推

本书覆盖的内容

第一部分:理论篇

  1. 什么是神经网络 — 神经元、层、两层网络
  2. 矩阵与维度 — 矩阵乘法、批量处理
  3. 激活函数 — Sigmoid / ReLU / Softmax 及求导
  4. 前向传播 — 带维度标注的完整推导
  5. 损失函数 — 交叉熵的直觉与推导
  6. 反向传播 — 链式法则,梯度逐层推导
  7. 优化器 — SGD / Momentum / Adam

第二部分:项目篇

  1. 项目结构总览 — 文件职责与数据流
  2. 数据加载与处理 — MNIST、归一化
  3. 激活与损失函数实现 — functions.py
  4. 模型实现 — model.py,反向传播代码
  5. 优化器实现 — optimizer.py
  6. 训练器 — trainer.py,训练循环
  7. 完整训练流程 — main.py + config.py

基于 Kaggle MNIST 数据集,使用纯 numpy 从零实现