深度学习实验：比较 2 层和 3 层神经网络的性能

本文通过实验比较了 2 层和 3 层神经网络在 MNIST 手写数字数据集上的性能，并探讨了不同学习率、梯度下降方法、运算迭代次数和平均损失间隔对梯度下降和损失函数值的影响。

神经网络结构:

2 层神经网络: 输入层 (784 个神经元) - 隐藏层 (256 个神经元) - 输出层 (10 个神经元)
3 层神经网络: 输入层 (784 个神经元) - 隐藏层 1 (256 个神经元) - 隐藏层 2 (128 个神经元) - 输出层 (10 个神经元)

数据集: MNIST 手写数字数据集，包含 60,000 个训练样本和 10,000 个测试样本。

实验框架: Python 语言和 Tensorflow 框架。

实验方案:

实验步骤:

最佳实验结果:

2 层神经网络:
- 学习率: 0.1
- 梯度下降方法: 小批量梯度下降
- 运算迭代次数: 1000
- 平均损失间隔: 100
- 测试准确率: 97.56%
3 层神经网络:
- 学习率: 0.1
- 梯度下降方法: 小批量梯度下降
- 运算迭代次数: 1000
- 平均损失间隔: 100
- 测试准确率: 98.03%

激活函数:

说明: 以上实验结果仅供参考，实际结果可能因具体实现和环境而有所不同。