一、事件回顾:灰度发布失控引发的连锁反应 某主流云服务商在12月5日发生的全球性服务中断,距离上次故障仅间隔17天。初步分析显示,此次事故源于核心组件的灰度发布流程失控:运维团队在未完成全链路压力测试的情……