xi4oh4o
基于HBase和Kafka作数仓分层;数据原始层ODS,通Canal或MaxWell监听数据库binlog,打入Kafka;通过Flink流式处理清洗数据,并拆分出事实表数据和维度表数据,维度表数据写入HBase,事实表写入Kafka;Flink流式处理对接第二层Kafka,进行流与流Join得到聚合数据;流数据聚合后再使用Flink Async IO功能关联HBase维度表数据,获得宽表数据;通过Flink将宽表数据写入HBase中;HBase宽表rowkey设计
xi4oh4o
byc888
yangbaojin1988
dontkillme
xing393939
mrsup
haoflynet
WenryXu
zjhui
wwek
wpexia
ageng