引言 在音视频内容爆发式增长的今天,高效提取文字信息的需求愈发迫切。无论是会议记录、视频剪辑还是教育场景,音视频转文字技术已成为提升效率的关键工具。然而,传统方案依赖云端API,存在隐私泄露、网络依赖及……