一、双十一前的数据准备:构建用户行为全景图 1.1 历史数据清洗与特征工程 双十一流量洪峰前,淘宝技术团队需对过去三年交易数据进行深度清洗。通过Spark SQL实现多维度数据聚合,例如: SELECT user_id, ……