Hadoop 在 CentOS 上如何配置

以下是在CentOS上配置Hadoop的步骤:

  1. 安装Java:使用sudo yum install -y java-1.8.0-openjdk-devel命令安装OpenJDK 8。
  2. 下载并解压Hadoop:从官网下载,如wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz,然后tar -xzvf hadoop-3.3.1.tar.gz,并sudo mv hadoop-3.3.1 /usr/local/hadoop
  3. 配置环境变量:编辑~/.bashrc,添加export HADOOP_HOME=/usr/local/hadoopexport PATH=$PATH:$HADOOP_HOME/binexport JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk,运行source ~/.bashrc使其生效。
  4. 配置Hadoop文件
    • core-site.xmlfs.defaultFShdfs://localhost:9000
    • hdfs-site.xmldfs.replication1dfs.namenode.name.dirfile:/usr/local/hadoop/dfs/namedfs.datanode.data.dirfile:/usr/local/hadoop/dfs/data
    • mapred-site.xml:先复制模板cp mapred-site.xml.template mapred-site.xml,再添加mapreduce.framework.nameyarn
    • yarn-site.xmlyarn.nodemanager.aux -servicesmapreduce_shuffleyarn.nodemanager.aux -services.mapreduce.shuffle.classorg.apache.hadoop.mapred.ShuffleHandler
  5. 格式化HDFS:执行hdfs namenode -format
  6. 启动Hadoop:运行start-dfs.shstart-yarn.sh