kylin学习笔记

时间:2023-03-09 13:11:02
kylin学习笔记

阅读官网,学到哪就写到哪

1、需要先建立Model

2、kylin需要配置事实表,纬度表;可以自定义join。  我的用法和官方建议的不同,我是直接在hive中将所有的取join成一个单表,再根据单表进行cude kylin。 因为我的join的同时有一些业务上的处理。

3、需要选择cude的纬度字段和聚合的度量字段;纬度字段可以在所有的表中选择,度量字段只能在事实表中选择(度量字段就是被sum,avg,count的字段)

4、建立MODEL时,需要选择partition,一般是按天进行增量。

5、cude时,可以根据需求选择使用使用“层次”和“派生”,进行优化

1)、层次,添加字段之间的依赖,只能组合字段进行cube,减少cude的复杂度

2)、派生,将多字段组合成一个字段(即主键),根据主键进行查询。

3)、组合,指定组合字段,cube时按组合进行cube,减少cube的复杂度

6、