一、Whisper显存占用过高的技术根源 1.1 模型架构特性导致的显存压力 Whisper作为基于Transformer架构的语音识别模型,其显存占用主要来自三个层面:首先,模型参数量级庞大,以”whisper-large-v2”为例,参数量达1……