Kafka

kafka 是什么

Kafka 是一个开源的分布式事件流平台，是分布式、高吞吐、可扩展、持久化的消息队列系统，被广泛应用于大数据实时处理、消息队列的，等场景，最初由 LinkedIn 开发，后捐献给 Apache 基金会。

主要应用场景包括

志收集系统
微服务之间的解耦通信
实时流式数据处理（如 Kafka + Flink/Spark）
事件驱动架构（EDA）的核心通道

设计目标

高吞吐：每秒百万级消息
可扩展：支持水平扩展
高可用：数据通过副本机制保障
持久性：消息写入磁盘，具备日志系统的能力

架构设计

                 +-------------------+
                 |   Kafka Cluster   |
                 +-------------------+
                     |         |
                     |         |
                +--------+  +--------+
                |Broker 1|  |Broker 2|  ... Broker N
                +--------+  +--------+
                    |             |
            -----------------------------
            |                           |
     +-------------+           +---------------+
     |   Producer  |           |   Consumer     |
     +-------------+           +---------------+

组件说明：

组件	作用
Producer	生产者，负责发送消息到 Kafka
Consumer	消费者，从 Kafka 读取消息
Topic	主题，消息的分类容器（逻辑划分）
Partition	分区，主题的物理分片，Kafka 并发和顺序保证的关键
Broker	Kafka 的一个服务器实例，一个节点
Kafka Cluster	Kafka 集群，由多个 Broker 组成
Zookeeper（或 KRaft）	用于管理 Kafka 集群的元数据、选举、健康状态等（新版本支持去 ZK 的 KRaft 模式）

组件功能详细介绍

1. Topic（主题）

基本定义 Topic 是 Kafka 中的“主题”或“消息分类通道”，是消息逻辑归属的单位，是Kafka中消息的分类容器，所有消息都必须发送到某个主题中，消费者也只能从指定的 Topic 中消费。

类比理解： Kafka 是邮局 Topic 是收件地址 Producer 是寄件人 Consumer 是收件人

设计理念

逻辑隔离 Kafka 是一个“多租户”的平台，不同系统/模块间不能互相干扰。每个业务（比如订单系统、支付系统）可以用一个 Topic。
支持大规模分布式并发处理一个 Topic 可以被划分成多个 Partition，每个 Partition 可以在不同的 Broker 上并发处理消息。Partition 提供了 Kafka 的可扩展性和高吞吐性。
支持灵活的订阅模式 Kafka 支持一对一（一组消费者只消费一份数据）或一对多（多组消费者各自消费）模式。多个消费者组可以重复消费同一个 Topic 的消息，互不干扰。

Topic 的使用场景（典型业务实践）

✅ 场景 1：日志收集系统

不同服务将日志发送到不同的 Topic，例如：access-log,error-log,debug-log等 Kafka可以与 ELK、Flink 等工具协同做实时处理。

✅ 场景 2：电商平台的订单系统

用户下单后，消息发送到 Topic：order-created
支付成功后，写入 Topic：order-paid
发货通知写入 Topic：order-shipped

多个系统（库存、物流、通知）可以各自监听不同 Topic 或同一个 Topic 的不同分区。

✅ 场景 3：用户行为埋点

将用户点击、搜索、浏览等行为数据写入一个 Topic：user-events

后台系统实时处理用户数据，生成推荐、个性化配置等。

✅ 场景 4：消息驱动的微服务架构

A 系统发送消息到 user-signup，B、C、D 系统都订阅该 Topic，异步做“发邮件”、“发优惠券”、“写入 CRM”等逻辑。

Topic常用命令

默认你已安装 Kafka 并位于其根目录，命令都在 bin/ 目录下

创建topic

bash

# 创建一个名为 test-topic 的 Topic，3 个分区，1 个副本
bin/kafka-topics.sh --create \
    --bootstrap-server localhost:9092 \
    --replication-factor 1 \
    --partitions 3 \
    --topic test-topic

查看topic

bash

bin/kafka-topics.sh --list --bootstrap-server localhost:9092

查看topic详情

bash

bin/kafka-topics.sh --describe --topic test-topic --bootstrap-server localhost:9092

输出类似：

yaml

Topic: test-topic  PartitionCount:3  ReplicationFactor:1  Configs:segment.bytes=1073741824
    Partition: 0  Leader: 0  Replicas: 0  Isr: 0
    Partition: 1  Leader: 0  Replicas: 0  Isr: 0
    Partition: 2  Leader: 0  Replicas: 0  Isr: 0

解释：

Leader：当前负责读写的副本所在 broker ID
Replicas：该 partition 的所有副本
Isr（In-Sync Replicas）：当前和 leader 同步的副本列表

删除 Topic

bash

bin/kafka-topics.sh --delete --topic test-topic --bootstrap-server localhost:9092

⚠️ 注意：需要在 server.properties 中配置 delete.topic.enable=true,删除不是立即生效，Kafka 会异步清理

增加 Topic 的 Partition（⚠️ 注意顺序性问题）

bash

bin/kafka-topics.sh --alter \
    --topic test-topic \
    --bootstrap-server localhost:9092 \
    --partitions 6

增加分区会打破原有 key 的 hash 到分区的规律，可能导致乱序（生产者有指定 key 的情况下）

2. Partition（分区）

基本定义

Partition 是 Kafka 中 Topic 的物理子集，是消息的最小存储和并发处理单位,一个 Topic 可以包含多个Partition,一个Partition内部的消息是严格有序的（按 offset）,每个 Topic 被切分为多个分区。每个分区是一个有序的、不可变的消息队列。

Kafka 的 Topic 类似一个“大水池”，而 Partition 是水池中并列的“水管”，数据是通过不同的水管进出。

设计理念

Partition 的设计为 Kafka 提供了可扩展性、高可用性、顺序性，主要体现在以下几方面：

分布式并发能力多个 Partition 可以分布在不同的 Broker 上，Producer 和 Consumer 可以并发对多个 Partition 读写，大幅提升性能。
高吞吐 + 可水平扩展当负载增加时，只需要增加 Partition 数量和 Consumer 数量，就可以轻松扩容。
提供“局部有序”保障 Kafka 不保证 Topic 级别的全局顺序，但每个 Partition 内的消息是有序的。如果你希望消息是有序的，应将相关消息定向发送到同一个 Partition（通过设置 key）。

Partition 的常用命令

创建 Topic 时指定分区数

bash

bin/kafka-topics.sh --create \
  --topic user-log \
  --partitions 4 \
  --replication-factor 1 \
  --bootstrap-server localhost:9092
--partitions 4：
#创建 4 个分区，Partition-0 到 Partition-3。

修改分区数量（增加）

bash

bin/kafka-topics.sh --alter \
  --topic user-log \
  --partitions 6 \
  --bootstrap-server localhost:9092

⚠️ 注意：只能增加分区数，不能减少。增加后会影响有 key 的消息顺序性（key 到 partition 的映射会变）。

查看特定 Partition 的消息（开发测试时常用）

bash

bin/kafka-console-consumer.sh \
  --bootstrap-server localhost:9092 \
  --topic user-log \
  --partition 0 \
  --from-beginning

指定 key 发送到特定 Partition（生产者发送）

bash


bin/kafka-console-producer.sh \
  --broker-list localhost:9092 \
  --topic user-log \
  --property "parse.key=true" \
  --property "key.separator=:"

Kafka 会根据 key 的 hash 决定 Partition。

分区数如何设计？（关键实践建议）

需求场景	建议分区数
小型测试环境	1-3
单 Topic 吞吐 10MB/s	≥ 3
每秒几万条消息的系统	10-30
实时大数据处理	50+，但需测压验证

实践建议

分区数量 ≈ 预期消费者数量 × 每消费者处理能力 × 并发系数不能一味多，过多分区会带来副作用：

控制器压力变大
文件句柄数量多
Topic 管理复杂
Broker 重启慢

版本升级

Kafka 3.9.1 与 4.0.0 的主要差异

元数据管理方式
• 3.9.1：仍可选择 ZooKeeper 或 KRaft 模式；3.9 系列被官方定位成“废除 ZooKeeper 前的最后一个桥接版本”。
• 4.0.0：完全移除 ZooKeeper，只支持 KRaft 模式（Kafka Raft Metadata 模式）。
升级路径
• 3.9.1 → 4.0.0 必须先完成 ZooKeeper → KRaft 迁移，然后才能滚动升级到 4.0.0；在 3.9 里可利用动态 KRaft Quorum 工具减少停机时间。
• 若已运行在 3.9 的 KRaft 模式，可直接升级到 4.0.0。
新功能（仅 4.0.0 提供）
• 新一代消费者重平衡协议（KIP-848），增量、协同重平衡，减少全局暂停。
• 共享组/队列语义（KIP-932，实验性），支持同分区多消费者。
• 事务服务端防御（KIP-890）、合格首领副本（KIP-966）等增强的复制与事务协议。
运行环境要求
• Java：3.9.1 仍支持 Java 8/11；4.0.0 最低要求 Java 17（服务端）/Java 11（客户端）。
• 移除对 2018 年以前老协议版本的支持，客户端最低需 2.1.0。
运维与生态变化
• 官方 Docker 镜像：4.0.0 首次提供基于 Java 21 的官方镜像（KIP-975）。
• 日志框架：3.9.1 仍可用 Log4j 1.x；4.0.0 升级到 Log4j2（KIP-653）。
• MirrorMaker 1 在 4.0.0 中被彻底移除，仅保留 MirrorMaker 2。

4.0.0 升级

Kafka 4.0.0 的 6 大重量级特性

彻底移除 ZooKeeper，默认 KRaft
4.0.0 是第一个 完全不依赖 ZooKeeper 的正式大版本；集群元数据、控制器选举全部由内置的 KRaft（Kafka-Raft）协议接管，部署和运维大幅简化。
全新消费者组协议（KIP-848）
重平衡逻辑从客户端移到 Broker，实现 增量、协同式 Rebalance，秒级完成，极大降低大规模消费组扩缩容时的停顿与重复消费。
Queues for Kafka（KIP-932，早期访问）
引入 共享组（Share Group） 概念，让同一分区可被多个消费者 公平共享、顺序确认，原生支持“队列/点对点”语义，弥补过去只能 Pub/Sub 的不足。
Java 版本与依赖大升级
• Broker / Connect / Tools 最低 Java 17
• Clients / Streams 最低 Java 11
• 移除对 Scala 2.12、Log4j 1.x 及大量已弃用 API 的支持。
Kafka Streams 能力增强
• KIP-1104：KTable 外键连接支持从 key/value 提取外键
• KIP-1112：允许自定义处理器包装器
• KIP-1065：ProductionExceptionHandler 支持 retry 策略。
运维与可观测性改进
• 支持客户端注册 自定义指标（KIP-714 扩展）
• 官方 Docker 镜像默认基于 Java 21
• 预投票机制、合格领导者副本（ELR 预览）等进一步提升高可用与可观测性。

Kafka 4.0.0 是一次“去 ZooKeeper”的架构级换代，同时带来了 秒级 Rebalance、原生队列语义、强制 Java 17 等重磅特性，让部署更简单、性能更高、场景更丰富。

启动

docker 启动

bash

docker run --name kafka-native -d \
  -e KAFKA_NODE_ID=1 \
  -e KAFKA_PROCESS_ROLES=broker,controller \
  -e KAFKA_LISTENERS=PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093 \
  -e KAFKA_ADVERTISED_LISTENERS=PLAINTEXT://localhost:9092 \
  -e KAFKA_CONTROLLER_QUORUM_VOTERS=1@localhost:9093 \
  -e KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR=1 \
  -p 9092:9092 \
  apache/kafka-native:4.0.0

变量名	默认值	说明
KAFKA_NODE_ID	1	节点唯一 ID（KRaft 必填）
KAFKA_PROCESS_ROLES	broker,controller	该节点承担的角色组合
KAFKA_LISTENERS	PLAINTEXT://0.0.0.0:9092	监听协议与端口
KAFKA_ADVERTISED_LISTENERS	与 LISTENERS 相同	客户端或内部发现的地址
KAFKA_CONTROLLER_QUORUM_VOTERS	1@localhost:9093	整个控制集群的 voter 列表
KAFKA_CONTROLLER_LISTENER_NAMES	CONTROLLER	控制器监听器名字
KAFKA_LISTENER_SECURITY_PROTOCOL_MAP	PLAINTEXT:PLAINTEXT,CONTROLLER:PLAINTEXT	监听器→协议映射
KAFKA_LOG_DIRS	/tmp/kraft-combined-logs	日志目录
KAFKA_NUM_PARTITIONS	1	默认主题分区数
KAFKA_DEFAULT_REPLICATION_FACTOR	1	默认副本因子
KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR	3	__consumer_offsets 副本数
KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR	3	事务日志副本数
KAFKA_TRANSACTION_STATE_LOG_MIN_ISR	2	事务日志最小 ISR
KAFKA_LOG_RETENTION_HOURS	168	日志保留时长
KAFKA_LOG_RETENTION_BYTES	-1（无限制）	日志保留大小
KAFKA_LOG_SEGMENT_BYTES	1073741824	日志段大小
KAFKA_COMPRESSION_TYPE	producer	全局压缩类型
KAFKA_SOCKET_REQUEST_MAX_BYTES	104857600	单次请求最大字节
KAFKA_NUM_NETWORK_THREADS	3	网络线程数
KAFKA_NUM_IO_THREADS	8	IO 线程数
KAFKA_HEAP_OPTS	-Xmx1G -Xms1G	JVM 堆大小（对 native 镜像依然生效）
KAFKA_JMX_OPTS	未设置	开启 JMX 监控
KAFKA_OPTS	未设置	其他 JVM 参数

三节点高可用 docker-compose.yml（本地开发）

yaml

version: "3.8"
services:
  kafka1:
    image: apache/kafka-native:4.0.0
    ports: ["9092:9092"]
    environment:
      KAFKA_NODE_ID: 1
      KAFKA_PROCESS_ROLES: broker,controller
      KAFKA_LISTENERS: PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://kafka1:9092
      KAFKA_CONTROLLER_QUORUM_VOTERS: 1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
      KAFKA_DEFAULT_REPLICATION_FACTOR: 3
      KAFKA_OFFSETS_TOPIC_REPLICATION_FACTOR: 3
      KAFKA_TRANSACTION_STATE_LOG_REPLICATION_FACTOR: 3
    volumes: [kafka1-data:/tmp/kraft-combined-logs]
    networks: [kafka-net]

  kafka2:
    image: apache/kafka-native:4.0.0
    ports: ["9093:9092"]
    environment:
      KAFKA_NODE_ID: 2
      KAFKA_PROCESS_ROLES: broker,controller
      KAFKA_LISTENERS: PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://kafka2:9092
      KAFKA_CONTROLLER_QUORUM_VOTERS: 1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
      # 其余同上
    volumes: [kafka2-data:/tmp/kraft-combined-logs]
    networks: [kafka-net]

  kafka3:
    image: apache/kafka-native:4.0.0
    ports: ["9094:9092"]
    environment:
      KAFKA_NODE_ID: 3
      KAFKA_PROCESS_ROLES: broker,controller
      KAFKA_LISTENERS: PLAINTEXT://0.0.0.0:9092,CONTROLLER://0.0.0.0:9093
      KAFKA_ADVERTISED_LISTENERS: PLAINTEXT://kafka3:9092
      KAFKA_CONTROLLER_QUORUM_VOTERS: 1@kafka1:9093,2@kafka2:9093,3@kafka3:9093
      # 其余同上
    volumes: [kafka3-data:/tmp/kraft-combined-logs]
    networks: [kafka-net]

volumes:
  kafka1-data:
  kafka2-data:
  kafka3-data:

networks:
  kafka-net:

启动步骤：

bash

docker compose up -d
docker exec -it kafka1 kafka-topics.sh --create --topic demo --bootstrap-server kafka1:9092 --partitions 3 --replication-factor 3

Kafka ​

kafka 是什么 ​

主要应用场景包括 ​

设计目标 ​

架构设计 ​

组件功能详细介绍 ​

1. Topic（主题） ​

设计理念 ​

Topic 的使用场景（典型业务实践） ​

Topic常用命令 ​

2. Partition（分区） ​

基本定义 ​

设计理念 ​

Partition 的常用命令 ​

分区数如何设计？（关键实践建议） ​

实践建议 ​

版本升级 ​

4.0.0 升级 ​

启动 ​

三节点高可用 docker-compose.yml（本地开发） ​

Kafka

kafka 是什么

主要应用场景包括

设计目标

架构设计

组件功能详细介绍

1. Topic（主题）

设计理念

Topic 的使用场景（典型业务实践）

Topic常用命令

2. Partition（分区）

基本定义

设计理念

Partition 的常用命令

分区数如何设计？（关键实践建议）

实践建议

版本升级

4.0.0 升级

启动

三节点高可用 docker-compose.yml（本地开发）