大数据 - 实时数仓项目 收藏

344人加入学习
价格
免费
教学计划
学习有效期
永久有效

基于HBase和Kafka作数仓分层;数据原始层ODS,通Canal或MaxWell监听数据库binlog,打入Kafka;通过Flink流式处理清洗数据,并拆分出事实表数据和维度表数据,维度表数据写入HBase,事实表写入Kafka;Flink流式处理对接第二层Kafka,进行流与流Join得到聚合数据;流数据聚合后再使用Flink Async IO功能关联HBase维度表数据,获得宽表数据;通过Flink将宽表数据写入HBase中;HBase宽表rowkey设计

主讲老师

宋红康

课程数: 18门
学生数: 7.2千人
东北师大理学学士,北京航空航天大学硕士。先后担任过高级软件开发工程师,系统架构师,高级讲师。具备丰富的软件开发经验和教学经验。精通C/C++、Java、Objective-C 等开发语言, 对JavaEE、Android开发有深入理解,对以Java语言为基础的各种框架有深入研究。
最新成员

xi4oh4o

byc888

yangbaojin1988

dontkillme

xing393939

mrsup

haoflynet

WenryXu

zjhui

wwek

wpexia

ageng

为你推荐 换一批