Zookeeper故障排查步骤如下:
- 检查服务状态:通过
jps或systemctl命令确认Zookeeper进程是否运行。 - 查看日志文件:分析
zookeeper.out或zookeeper.log,定位错误信息(如配置错误、端口冲突等)。 - 验证配置文件:检查
zoo.cfg中dataDir、clientPort、server.x等参数是否正确,确保与集群节点配置一致。 - 监控集群状态:使用四字命令(如
stat、ruok、mntr)通过nc或telnet查看节点角色、连接状态、性能指标等。 - 检查网络连接:用
ping、telnet测试节点间通信,确认防火墙未拦截默认端口(2181)。 - 处理节点故障:排查节点宕机、磁盘I/O异常,清理数据目录(
dataDir/dataLogDir)后重启服务。 - 调整系统资源:确保内存、CPU、磁盘空间充足,优化
tickTime、initLimit等参数提升稳定性。 - 客户端问题排查:检查客户端连接参数,使用
zkCli.sh测试命令执行,确认会话超时或权限问题。
参考来源: