一、RNN的局限性与LSTM的诞生背景 传统RNN通过隐藏状态传递时序信息,但在处理长序列时面临两大核心问题: 梯度消失/爆炸:反向传播时,梯度在时间步上连乘,导致指数级衰减或增长,使模型难以学习远距离依赖关系……