汉语拼音拼写学习：循环神经网络模型数据准备与构建

使用循环神经网络学习汉语拼音拼写：数据准备与模型构建

本实验使用循环神经网络学习汉语拼音拼写，重点介绍数据准备和模型构建过程。

实验使用无音调的拼音数据，数据链接：https://www.jianguoyun.com/p/DQ3els0Q-rqYBhi3pIgFIAA

采用字符模型，因此一个字符为一个样本。每个样本采用 one-hot 编码。

样本是时间相关的，分别实现序列的随机采样和序列的顺序划分。

标签 Y 与 X 同形状，但时间超前 1。

一次梯度更新使用的数据形状为：（时间步，Batch，类别数）。

6.1. 循环单元: 使用 nn.RNN 或 GRU 作为循环单元。

6.2. 输出层: 使用 RNN 所有时间步的输出进行全连接。

6.3. 隐状态初始值: 设置为 0。

6.4. 测试前向传播: 进行前向传播测试。

6.5. 梯度截断: 如果采用顺序划分，则需要进行梯度截断。

损失函数使用平均交叉熵。

给定一个前缀，进行单步预测和 K 步预测。

计算预测结果与真实标签的准确率。可以使用编辑距离作为评估指标，即计算预测结果与真实标签间的编辑距离，再除以真实标签长度。