Kafka单机部署搭建指南：从零开始构建单机版Kafka环境

摘要

Kafka作为分布式流处理平台的核心组件，单机部署是开发者快速验证功能、本地调试或构建轻量级消息队列的首选方案。本文从环境准备、ZooKeeper与Kafka安装、配置优化到启动验证，系统阐述单机版Kafka的部署流程，并提供生产环境适配建议，帮助读者高效完成搭建。

一、环境准备与前提条件

1.1 硬件与系统要求

操作系统：推荐Linux（CentOS/Ubuntu）或macOS，Windows需通过WSL2或Docker模拟环境。
资源需求：最低2核CPU、4GB内存、20GB磁盘空间（生产环境需按数据量扩容）。

Java环境：Kafka依赖Java运行环境，需安装JDK 8或更高版本（推荐OpenJDK 11）。

# Ubuntu示例：安装OpenJDK 11
sudo apt update
sudo apt install openjdk-11-jdk -y
java -version  # 验证安装

1.2 网络与端口规划

默认端口：
- ZooKeeper：2181（客户端连接）、2888（节点通信）、3888（选举）。
- Kafka：9092（Broker监听端口）。
防火墙配置：开放上述端口，避免因拦截导致连接失败。
```
# Ubuntu示例：开放9092端口
sudo ufw allow 9092/tcp
```

二、ZooKeeper单机部署

Kafka依赖ZooKeeper进行元数据管理（如Broker列表、Topic分区信息），单机环境下需部署单节点ZooKeeper。

2.1 下载与解压

从Apache官网下载稳定版ZooKeeper（如3.8.1）：

wget https://dlcdn.apache.org/zookeeper/zookeeper-3.8.1/apache-zookeeper-3.8.1-bin.tar.gz
tar -xzf apache-zookeeper-3.8.1-bin.tar.gz -C /opt/
cd /opt/apache-zookeeper-3.8.1-bin/

2.2 配置文件修改

编辑conf/zoo.cfg，设置数据目录和端口：

tickTime=2000
dataDir=/var/lib/zookeeper
clientPort=2181
initLimit=5
syncLimit=2

创建数据目录并设置权限：

sudo mkdir -p /var/lib/zookeeper
sudo chown -R $(whoami):$(whoami) /var/lib/zookeeper

2.3 启动与验证

# 启动ZooKeeper
bin/zkServer.sh start
# 验证状态
echo "stat" | nc localhost 2181  # 返回"Mode: standalone"表示成功

三、Kafka单机部署

3.1 下载与解压

从Apache官网下载Kafka（如3.6.1）：

wget https://dlcdn.apache.org/kafka/3.6.1/kafka-3.6.1-src.tgz
tar -xzf kafka-3.6.1-src.tgz -C /opt/
cd /opt/kafka-3.6.1-src/

3.2 核心配置优化

编辑config/server.properties，关键参数如下：

# Broker唯一ID（单机环境设为1）
broker.id=1
# 监听地址与端口
listeners=PLAINTEXT://:9092
advertised.listeners=PLAINTEXT://localhost:9092
# 日志存储路径
log.dirs=/tmp/kafka-logs
# ZooKeeper连接地址
zookeeper.connect=localhost:2181
# 消息保留策略（7天）
log.retention.hours=168

生产环境建议：

修改log.dirs为独立磁盘路径（如/data/kafka-logs）。
启用SSL加密（listeners=SSL://:9093）和ACL权限控制。

3.3 启动Kafka服务

# 启动Broker（后台运行）
bin/kafka-server-start.sh -daemon config/server.properties
# 验证进程
jps | grep Kafka

四、功能验证与测试

4.1 创建Topic

bin/kafka-topics.sh --create \
  --topic test-topic \
  --bootstrap-server localhost:9092 \
  --partitions 1 \
  --replication-factor 1

4.2 生产者与消费者测试

发送消息：

bin/kafka-console-producer.sh --topic test-topic --bootstrap-server localhost:9092

输入任意文本后按Ctrl+D结束。

消费消息：

bin/kafka-console-consumer.sh --topic test-topic --from-beginning --bootstrap-server localhost:9092

若能正确显示之前发送的消息，则部署成功。

五、生产环境优化建议

5.1 性能调优

JVM参数：修改bin/kafka-run-class.sh，调整堆内存（如-Xmx2G -Xms2G）。
日志分段：设置segment.bytes=1073741824（1GB）避免单个日志文件过大。
并行处理：根据CPU核心数调整num.network.threads和num.io.threads。

5.2 监控与运维

集成Prometheus：通过JMX暴露指标，使用Grafana可视化。
日志轮转：配置log4j.properties限制日志文件大小和保留周期。

5.3 故障排查

Broker无法启动：检查logs/server.log中的错误（如端口冲突、ZooKeeper连接失败）。
消息丢失：确认replication.factor与min.insync.replicas设置。

六、总结与扩展

单机版Kafka适用于开发测试、轻量级应用或边缘计算场景。对于生产环境，建议部署至少3个节点的集群以实现高可用。通过本文的步骤，读者可快速完成单机部署，并基于实际需求进一步优化配置。未来可探索Kafka Streams、Kafka Connect等高级功能的集成，构建完整的流处理管道。