以下是在CentOS上配置Hadoop的步骤:
- 安装Java:使用
sudo yum install -y java-1.8.0-openjdk-devel命令安装OpenJDK 8。 - 下载并解压Hadoop:从官网下载,如
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz,然后tar -xzvf hadoop-3.3.1.tar.gz,并sudo mv hadoop-3.3.1 /usr/local/hadoop。 - 配置环境变量:编辑
~/.bashrc,添加export HADOOP_HOME=/usr/local/hadoop、export PATH=$PATH:$HADOOP_HOME/bin、export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk,运行source ~/.bashrc使其生效。 - 配置Hadoop文件:
- core-site.xml:
。fs.defaultFS hdfs://localhost:9000 - hdfs-site.xml:
。dfs.replication 1 dfs.namenode.name.dir file:/usr/local/hadoop/dfs/name dfs.datanode.data.dir file:/usr/local/hadoop/dfs/data - mapred-site.xml:先复制模板
cp mapred-site.xml.template mapred-site.xml,再添加。mapreduce.framework.name yarn - yarn-site.xml:
。yarn.nodemanager.aux -services mapreduce_shuffle yarn.nodemanager.aux -services.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler
- core-site.xml:
- 格式化HDFS:执行
hdfs namenode -format。 - 启动Hadoop:运行
start-dfs.sh和start-yarn.sh。