一、环境规划与系统要求

1.1 集群架构设计

推荐采用1主节点+N从节点的分布式架构，以3节点集群为例：

主节点：承担Ambari Server、数据库（MySQL）、反向代理（Nginx）角色
从节点：运行Ambari Agent服务，参与数据存储与计算
硬件配置：主节点建议8核16G内存，从节点4核8G内存起步
网络拓扑：所有节点需处于同一子网，建议使用千兆内网通信

1.2 操作系统选择

版本兼容性：Ambari 3.0官方支持CentOS 7/8，但需注意：
- CentOS 7需使用Ambari 2.7.x版本（详见历史文档）
- CentOS 8需安装EPEL仓库获取兼容依赖
系统初始化：建议使用最小化安装模式，关闭SELinux和防火墙服务

二、网络环境配置

2.1 静态IP设置

修改网卡配置文件（路径通常为/etc/sysconfig/network-scripts/ifcfg-ens*）：

BOOTPROTO=none
ONBOOT=yes
IPADDR=192.168.0.101
NETMASK=255.255.255.0
GATEWAY=192.168.0.1
DNS1=8.8.8.8

执行nmcli connection reload使配置生效，通过ip addr show验证设置。

2.2 主机名解析

编辑/etc/hosts文件建立集群内部解析：

192.168.0.101 server-master
192.168.0.102 server-worker1
192.168.0.103 server-worker2

使用hostnamectl set-hostname server-master设置主机名，通过ping server-worker1测试连通性。

三、核心组件安装

3.1 依赖环境准备

在所有节点执行：

yum install -y epel-release
yum install -y wget curl java-1.8.0-openjdk-devel

验证Java环境：

java -version  # 应显示1.8.x版本
echo $JAVA_HOME  # 应指向/usr/lib/jvm/java-1.8.0

3.2 数据库配置（主节点）

安装MySQL社区版：

yum install -y mysql-community-server
systemctl start mysqld

执行安全初始化：

mysql_secure_installation

创建Ambari专用数据库：

CREATE DATABASE ambari;
CREATE USER 'ambari'@'%' IDENTIFIED BY 'password';
GRANT ALL PRIVILEGES ON ambari.* TO 'ambari'@'%';
FLUSH PRIVILEGES;

3.3 Ambari Server安装

获取官方仓库配置（需替换为最新版本链接）：

wget [某托管仓库链接]/ambari.repo -O /etc/yum.repos.d/ambari.repo
yum install -y ambari-server

执行初始化配置：

ambari-server setup

关键配置项：

JDK选择：使用系统自带OpenJDK
数据库配置：选择自定义MySQL并输入连接信息
告警邮箱：可配置为本地回环地址

四、集群部署流程

4.1 启动部署向导

ambari-server start

通过浏览器访问http://server-master:8080，使用默认账号admin/admin登录。

4.2 集群注册步骤

命名集群：输入具有业务含义的名称（如prod-cluster）
选择版本：选择HDP 3.x或HDF 3.x栈（需提前准备本地仓库）
注册主机：
- 生成SSH密钥对：ssh-keygen -t rsa
- 将公钥分发至所有节点：ssh-copy-id server-worker1
- 在向导中指定主机列表（server-master,server-worker1,server-worker2）

4.3 服务组件选择

推荐基础配置：

核心服务：HDFS、YARN、ZooKeeper
管理服务：Ambari Metrics、Atlas（元数据管理）
可选服务：根据业务需求选择Hive、Spark、HBase

4.4 配置参数优化

关键参数调整示例：

HDFS NameNode内存：设置为总内存的60%
YARN NodeManager资源：yarn.nodemanager.resource.memory-mb=8192
容器内存限制：yarn.scheduler.maximum-allocation-mb=4096

五、部署后验证

5.1 服务状态检查

通过Ambari Web界面确认所有服务显示绿色运行状态，重点检查：

NameNode HA状态
ResourceManager健康度
ZooKeeper集群角色分布

5.2 基础功能测试

执行HDFS读写测试：

hdfs dfs -mkdir /test
hdfs dfs -put /etc/hosts /test/
hdfs dfs -cat /test/hosts

运行YARN示例作业：

yarn jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-mapreduce-examples.jar pi 2 5

六、常见问题处理

6.1 数据库连接失败

检查项：

MySQL服务是否运行：systemctl status mysqld
防火墙是否放行3306端口：firewall-cmd --list-ports
数据库用户权限：SHOW GRANTS FOR 'ambari'@'%';

6.2 Agent注册超时

解决方案：

检查主节点/etc/hosts配置是否包含所有主机映射
验证SSH免密登录是否正常工作
增加Ambari Server日志级别：ambari-server set-log-level DEBUG

6.3 服务启动失败

排查步骤：

查看服务日志：tail -100f /var/log/hadoop-yarn/yarn/yarn-yarn-resourcemanager-*.log
检查资源占用：free -h和df -h
验证配置文件语法：如hdfs getconf -confKey dfs.namenode.name.dir

七、运维建议

监控告警：配置Ambari Metrics监控阈值，设置关键服务告警
备份策略：定期备份Ambari数据库和配置文件
版本升级：关注官方安全公告，按小版本迭代升级
扩展性设计：预留20%资源余量，便于后续节点扩容

通过本指南的完整实施，读者可构建出具备生产环境标准的Hadoop集群，并通过Ambari实现可视化运维管理。建议结合具体业务场景调整配置参数，定期进行健康检查和性能优化。

Ambari 3.0 集群部署全攻略：从环境准备到服务启动