一、技术架构与核心实现原理 视频通话与语音转文字的融合系统需同时处理音视频流传输与语音识别任务,其技术架构可分为三层:传输层、处理层与应用层。 1.1 实时音视频传输优化 传输层需解决低延迟与高可靠性的矛……