探索性分析

时间:2024-03-15 09:29:02

总目录:SPSS学习整理


目的

初步了解数据分布情况,是否符合正态分布,箱图,检验数据异常值等。

适用情景

基本所有类型数据。

数据处理

探索性分析

SPSS操作

探索性分析
因子列表以及个案标注依据不是必要数据
探索性分析
探索性分析
探索性分析

SPSS输出结果分析

个案处理概要图就是数据完整性报告
描述变量图相当于描述性统计分析的结果,输出数据的基本信息。
M估计量好像是不同权重的均值预估,暂不知道啥用
百分位数相当于数据分布情况,50%就是中位数,25%就是第一个四分位数。
极值看看就行
探索性分析

正态性检验图,样本量大于50的话认‘柯尔莫戈洛夫-斯米诺夫’(左)检验结果,样本量小于50的话认‘夏皮洛-威尔克’检验结果,如显著性小于0.05则说明不符合正态分布假设,否则符合。
探索性分析
方差齐性检验结果,判断数据是否具有齐次性。(同指数相加)
均匀性,也称为齐次性,输入函数扩大a倍,而其响应函数相应的也扩大a倍。

Q-Q图斜线为正态分布标准线,以正态检验结果为准,不管这个。

探索性分析
箱图是个好东西,中间的横线代表中位数,蓝色的箱子由数据的两个四分位数包裹,也就是【25%,75%】。箱子外面的两条线的计算方法可百度,超过的数据用“o”或者“⭐”符号表示,‘o’代表超过距离超过箱子长度1.5-3倍,‘⭐’代表距离超过箱子长度三倍以上。均属于异常值、
如果箱子比较短,说明数据比较集中,反之数据比较分散。如果中间的横线靠近箱子下方说明数据分布类似正偏态,大多分布在左半区。

知识点