@ -1,5 +1,5 @@
## Kafka:
### 生产者消息分区机制原理剖析
### 消费者组到
#### __consumer_offsets: 如果你曾经惊讶于 Kafka 日志路径下冒出很多 __consumer_offsets-xxx 这样的目录,那么现在应该明白了吧,这就是 Kafka 自动帮你创建的位移主题啊。
#### 位移主题分区 offsets.topic.num.partitions 它的默认值是 50
#### 位移主题的 Key 中应该保存 3 部分内容:< Group ID , 主 题 名 , 分 区 号 > [groupId,topicName,partitionNumber]
@ -9,3 +9,15 @@
#### Log Compaction 策略来删除位移主题中的过期消息: The idea behind log compaction is selectively remove records where we have most recent update with the same primary key.
### 生产者压缩算法面面观
### 生产者消息分区机制原理剖析
1. org.apache.kafka.clients.producer.Partitioner
int partition(String topic, Object key, byte[] keyBytes, Object value, byte[] valueBytes, Cluster cluster);
这里的topic、key、keyBytes、value和valueBytes都属于消息数据, cluster则是集群信息
#### 分区策略
1. Round-robin
2. Randomness
3. Key-ordering
List< PartitionInfo > partitions = cluster.partitionsForTopic(topic);
return Math.abs(key.hashCode()) % partitions.size();