详解kafka中的消息分区分配算法-mile米乐体育
目录
- 背景
- rangeassignor
- 定义
- 源码分析
- 场景
- roundrobinassignor
- 定义
- 源码分析
- 场景
- stickyassignor
- 定义
- 场景
背景
kafka有分区机制,一个主题topic在创建的时候,会设置分区。如果只有一个分区,那所有的消费者都订阅的是这一个分区消息;如果有多个分区的话,那消费者之间又是如何分配的呢?
分配算法
rangeassignor
定义
kafka默认采⽤rangeassignor的分配算法。
rangeassignor策略的原理是按照消费者总数和分区总数进⾏整除运算来获得⼀个跨度,然 后将分区按照跨度进⾏平均分配,以保证分区尽可能均匀地分配给所有的消费者。对于每⼀个 topic,rangeassignor策略会将消费组内所有订阅这个topic的消费者按照名称的字典序排序,然 后为每个消费者划分固定的分区范围,如果不够平均分配,那么字典序靠前的消费者会被多分配 ⼀个分区。
这种分配⽅式明显的⼀个问题是随着消费者订阅的topic的数量的增加,不均衡的问题会越来 越严重,⽐如上图中4个分区3个消费者的场景,c0会多分配⼀个分区。如果此时再订阅⼀个分区 数为4的topic,那么c0⼜会⽐c1、c2多分配⼀个分区,这样c0总共就⽐c1、c2多分配两个分区 了,⽽且随着topic的增加,这个情况会越来越严重。
源码分析
public class rangeassignor extends abstractpartitionassignor { .... @override public map> assign(map partitionspertopic, map subscriptions) { // 1. 获取每个topic被多少个consumer订阅了 map
场景
可以完全平均分配
无法完全平均分配,排序靠前分的更多
消费者数量大于分区数量,排名靠前先分得,排名靠后未分得分区
roundrobinassignor
定义
roundrobinassignor的分配策略是将消费组内订阅的所有topi恰卡编程网c的分区及所有消费者进⾏排序后尽 量均衡的分配(rangeassignor是针对单个topic的分区进⾏排序分配的)。如果消费组内,消费者订阅 的topic列表是相同的(每个消费者都订阅了相同的topic),那么分配结果是尽量均衡的(消费者之间 分配到的分区数的差值不会超过1)。
源码分析
package org.apache.kafka.clients.consumer; public class roundrobinassignor extends abstractpartitionassignor { @override public map> assign(map partitionspertopic, map subscriptions) {
场景
无法完全平均分配,排序靠前分的更多
stickyassignor
定义
尽管roundrobinassignor已经在rangeassignor上做了⼀些优化来更均衡的分配分区,但是在⼀些情况下依旧会产⽣严重的分配偏差,从字⾯意义上看,sticky是“粘性的”,可以理解为分配结果是带“粘性的”——每⼀次分配变更相对 上⼀次分配做最少的变动(上⼀次的结果是有粘性的) 其⽬标有两点:
- 分区的分配尽量的均衡
- 每⼀次重分配的结果尽量与上⼀次分配结果保持⼀致
场景
到此这篇关于详解kafka中的消息分区分配算法的文章就介绍到这了,更多相关kafka消息分区分配算法内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!