以下是在 CentOS 上搭建 Hadoop 集群的一般步骤:
- 环境准备:
- 准备至少 3 台 CentOS 7 服务器,配置好静态 IP 和主机名,并确保网络连通。
- 在所有节点安装 JDK 8,配置
JAVA_HOME环境变量。
- 下载安装 Hadoop:
- 从官网下载 Hadoop 安装包,解压到指定目录,如
/opt/hadoop。 - 配置 Hadoop 环境变量,编辑
/etc/profile文件,添加相关内容并使生效。
- 从官网下载 Hadoop 安装包,解压到指定目录,如
- 配置 Hadoop 文件:
hadoop-env.sh:配置JAVA_HOME。core-site.xml:配置fs.defaultFS等。hdfs-site.xml:配置dfs.replication等。yarn-site.xml:配置 YARN 相关参数。mapred-site.xml:配置 MapReduce 相关参数。workers文件(可选):指定数据节点。
- 配置 SSH 免密登录:在主节点生成密钥对,将公钥分发到各从节点。
- 格式化 HDFS:在主节点执行
hdfs namenode -format(初次启动前执行)。 - 启动集群:在主节点执行
start-dfs.sh和start-yarn.sh。 - 验证集群:使用
jps命令检查各节点服务进程是否正常运行。