根据字段(变量)的类别,探讨字段之间的相关关系有:
① 两个连续字段间的关系;
② 两个分类字段间的关系;
③ 连续字段与分类字段间的关系。
1. 两个连续型变量的关系分析
案例:数据文件1995-5014GDP.xlsx。
数据展示:
分析: 国内生产总值与居民消费水平间关系
1.1 绘制散点图观察趋势特征
1.2 计算及检验相关系数
线性相关系数r的取值范围为[-1.1]。
当r>0时,表示两个变量线性正相关;
当r<0时,表示两个变量线性负相关。
r的绝对值代销反映了相关程度的强弱,在SPSS Modeler 中,相关系数r的大小取值与相关程度的定义如下:
实现:statistics节点
专门用于连续型变量的统计分析节点。
数据流:
1.2.1 statistics节点选项卡:
1.2.2 运行结果
2. 两个分类变量的关系分析
案例:Demo文件下的telco.sav数据文件。
数据展示:
分析: 不同学历水平的客户流失情况的关系
2.1 绘制堆积条形图观察趋势特征
借助分布节点绘制堆积条形图。
2.2 列联表及卡方检验
实现:矩阵节点
用于分析分类型变量的统计分析节点。
数据流:
2.2.1 矩阵节点选项卡:
设置选项卡:
外观选项卡: