1. 传统RNN的局限与LSTM的诞生背景 循环神经网络(RNN)通过隐藏状态传递时序信息,但其“梯度消失/爆炸”问题导致难以捕捉长距离依赖。例如在文本生成任务中,RNN可能因遗忘早期输入而无法保持语义连贯性。1997年,……