在数据分析中,数据来源多样化,可能包括数据库和本地Excel,甚至不同数据库中的多个表。由于业务性质不同,表的结构和颗粒度也会有所差异。
通常情况下,我们需要从多个表中提取数据进行分析,而不是将所有数据拼成一个大宽表。因为数据颗粒度不同,强行合成一个大表会损失数据细节,影响分析和探索。
数据颗粒度是指数据的详细程度,例如电商销售数据可能是交易时间到秒的记录,而员工月度绩效数据是到月。
数据建模是数据分析的关键环节,它涉及建立各个数据(表)之间的关系,即将各业务环节产生的数据关联起来。
在选择数据分析工具时,不仅要看支持多少种图表,更要看BI分析工具对数据建模的支持程度。
Tableau 2024.02版本推出了多事实表关系建模(Multi-fact Relationship),也可理解为关系建模(Relationship)的升级版。
以下是Tableau四种主要的建模方式及其演变:
联接与并集(Join/Union):通过联接将多个表合并为一个,导致列数大幅度增加;并集则是将几张列数相同的表纵向拼接起来,表的行数增加,列数不变。
混合(Blend):在分析需要时建立表之间的关联,而不改变原始表的结构。
关系(Relationship):包括物理层和逻辑层,物理层进行联接和并集,逻辑层与其他表发生关联,以共有字段进行关联,不会改变原始表结构。
关系 V2.0 - 多事实关系:解决了一个问题,即在一个表中同时与多个表进行关联,而不改变表关系。
Tableau四种数据模型包括联接与并集、混合、关系和多事实关系,希望对您有所帮助,Happy Viz!
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。