一、角色分割:语音识别场景下的核心需求 在会议记录、客服对话、影视字幕等场景中,语音数据往往包含多个说话人。传统语音识别模型将所有音频统一转换为文本,导致”谁说了什么”的信息丢失。角色分割(Speaker Dia……