Hadoop 集群在 CentOS 上如何搭建

以下是在 CentOS 上搭建 Hadoop 集群的一般步骤：

环境准备：
- 准备至少 3 台 CentOS 7 服务器，配置好静态 IP 和主机名，并确保网络连通。
- 在所有节点安装 JDK 8，配置 JAVA_HOME 环境变量。
下载安装 Hadoop：
- 从官网下载 Hadoop 安装包，解压到指定目录，如 /opt/hadoop。
- 配置 Hadoop 环境变量，编辑 /etc/profile 文件，添加相关内容并使生效。
配置 Hadoop 文件：
- hadoop-env.sh：配置 JAVA_HOME。
- core-site.xml：配置 fs.defaultFS 等。
- hdfs-site.xml：配置 dfs.replication 等。
- yarn-site.xml：配置 YARN 相关参数。
- mapred-site.xml：配置 MapReduce 相关参数。
- workers 文件（可选）：指定数据节点。
配置 SSH 免密登录：在主节点生成密钥对，将公钥分发到各从节点。
格式化 HDFS：在主节点执行 hdfs namenode -format（初次启动前执行）。
启动集群：在主节点执行 start-dfs.sh 和 start-yarn.sh。
验证集群：使用 jps 命令检查各节点服务进程是否正常运行。