一、系统架构设计 1.1 整体技术栈选型 本系统采用分层架构设计,底层依托Hadoop分布式计算框架,包含HDFS分布式文件系统与YARN资源管理模块。中间层使用Hive数据仓库进行结构化存储,Spark计算引擎负责实时数据分……