一、技术架构与核心模块 该工具采用模块化设计理念,将视频处理流程拆解为四个可独立扩展的子系统: 语音识别引擎(ASR)集成六类主流语音识别模型,包括: 轻量级本地模型:基于某开源社区优化的Faster-Whispe……