基于卷积神经网络的声音场景识别:理论、实践与优化