问卷调查中的加权处理

时间:2024-02-16 13:21:27

 调查问卷数据分析中经常遇到对数据进行加权的问题,什么是加权?沈浩老师博客中这样描述:让一些人变得比另一些人更重要!那为什么要加权为了让调查数据在特征的分布上更接近实际情况

比如在会员数据中,男女比例是6:4,而调查问卷的比例是7:3,为了使调查结果更贴近真实,首先需要对问卷进行加权处理,让问卷的分布结构跟实际分布保持一致。

 

        从概念上,加权:通过对总体中的各个样本设置不同的数值系数(即加权因子-权重),使样本呈现希望的相对重要性程度。通俗一些的公式:设计加权=某个变量或指标的期望比例/该变量或指标的实际比例。

 

        有一家数码产品专营店,它有一大批忠实的会员经常购买。为了更好的经营好自己即将要开设的网店,在会员中进行了一次购买习惯的问卷调查。在问卷的校验过程中,他们发现回收的问卷在人口特征的分布上与实际情况不符,会员中男女比例是6:4,而问卷中是7:3,并且男女会员实际在教育水平(1、2、3、4个档)的占比均为2:2:4:2。考虑到这两个因素可能对分析结果有较大的影响,现在需要对问卷数据进行加权处理,使得加权后的性别和教育水平能够符合实际比例。

汇总问卷数据,计算加权的权重

   根据“权重=变量的会员比例/该变量问卷比例”来计算最终的权重(本案例用这个公式)。

  熟悉excel电子表格的话,也可以利用excel的透视表功能快速对问卷数据进行汇总并计算权重,这里略过。

1.png 

        表格的“会员比例”即男女会员在教育水平的占比2:2:4:2,男性0.6,女性0.4。最后一列即根据公式计算而得到的“权重”。