引言 说话人分离(Speaker Diarization)是语音处理领域的关键技术,旨在将混合语音信号按说话人身份分割为独立片段,广泛应用于会议记录、智能客服、语音助手等场景。传统方法依赖声纹特征(如MFCC)与聚类算法,……