外观
一本面向深度学习初学者的小册子,带你用 PyTorch 从零实现一个能写唐诗的循环神经网络。
从语言模型的概率基础出发,逐步讲清词嵌入、RNN 时序建模、BPTT 训练原理,以及温度采样等推理策略。
与代码模块一一对应,逐行拆解 dataset / model / trainer / generator,最后给出一套完整的调参实验方案。
使用 313 首唐诗(2439 个不重复汉字)作为训练集,模型训练完成后即可逐字自回归地生成新诗。