汉语拼音拼写学习:循环神经网络模型数据准备与构建
使用循环神经网络学习汉语拼音拼写:数据准备与模型构建
本实验使用循环神经网络学习汉语拼音拼写,重点介绍数据准备和模型构建过程。
1. 拼音数据
实验使用无音调的拼音数据,数据链接:https://www.jianguoyun.com/p/DQ3els0Q-rqYBhi3pIgFIAA
2. 定义数据集
采用字符模型,因此一个字符为一个样本。每个样本采用 one-hot 编码。
3. 时间相关样本
样本是时间相关的,分别实现序列的随机采样和序列的顺序划分。
4. 标签
标签 Y 与 X 同形状,但时间超前 1。
5. 准备数据
一次梯度更新使用的数据形状为:(时间步,Batch,类别数)。
6. 实现基本循环神经网络模型
6.1. 循环单元: 使用 nn.RNN 或 GRU 作为循环单元。
6.2. 输出层: 使用 RNN 所有时间步的输出进行全连接。
6.3. 隐状态初始值: 设置为 0。
6.4. 测试前向传播: 进行前向传播测试。
6.5. 梯度截断: 如果采用顺序划分,则需要进行梯度截断。
7. 训练
损失函数使用平均交叉熵。
8. 预测
给定一个前缀,进行单步预测和 K 步预测。
9. 评估
计算预测结果与真实标签的准确率。可以使用编辑距离作为评估指标,即计算预测结果与真实标签间的编辑距离,再除以真实标签长度。
原文地址: https://www.cveoy.top/t/topic/ohPE 著作权归作者所有。请勿转载和采集!