一、核心概念与技术选型 语音转文字(Speech-to-Text, STT)技术通过声学模型和语言模型将音频信号转换为文本,其实现方式主要分为三类: 离线方案:依赖本地安装的语音识别引擎,无需网络连接 云服务API:调用第……