4.2.4 长短期记忆 (LSTM) 网络详解
4.2.4 长短期记忆 (LSTM) 网络
Hochreiter 和 Schmidhuber (1997) 开发的 LSTM 网络是递归神经网络 (RNN) 的扩展,旨在解决 RNN 中的梯度消失问题。LSTM 由一个存储单元组成,用于存储来自输入的信息。这个存储单元通过三个门控机制控制,分别是:
- 遗忘门 (Forget Gate):决定哪些信息应该从存储单元中丢弃。
- 输入门 (Input Gate):决定哪些信息应该被写入存储单元。
- 输出门 (Output Gate):决定哪些信息应该从存储单元中输出。
通过这三个门控机制,LSTM 可以有效地处理长序列数据,并避免梯度消失问题。
原文地址: https://www.cveoy.top/t/topic/lBYv 著作权归作者所有。请勿转载和采集!