一、事故时间线与核心指标 故障时间轴2025年1月15日03:17,监控系统触发多级告警: 0325:1247个Pod陆续进入CrashLoopBackOff状态 03:28:核心业务API可用性从99.9%骤降至12% 06:00:故障完全恢复,MTTR(……