SPSS数据抽取

时间:2024-04-17 21:03:43

SPSS数据抽取

数据抽取一般分为两类:字段拆分和随机抽样

字段拆分

数据抽取,也称为数据拆分,是只保留原数据表中的某些字段、记录的部分信息,形成一个新字段、新记录。

在spss中导入我们需要的数据,变量主要包含如下:

对于身份号码可以获取出生年、月、日

点击转换菜单栏下面的计算变量:

在函数组中选择字符串,在函数和特殊变量中选择Char.Substr(3),双击Char.Substr(3)则函数在数字表达式中显示。

数据CHAR.SUBSTR(身份证号码,7,4),第一个参数是要截取的变量,第二个参数是从哪个下标开始截取,第三个参数是一共要截取几个字符,目标变量起名为“年份”,类型与标签可以设置,点击确定。

同理,月份和日期也是一样的设置,CHAR.SUBSTR(身份证号码,11,2)和CHAR.SUBSTR(身份证号码,13,2)。

随机抽样

随机抽样,是按照随机的原则,也就是保证总体中的每个单位都有同等机会被抽中的原则,进行样本赝本抽取的一种方法。

随机抽样方法主要有简单随机抽样、分层抽样和系统抽样等。

点击数据菜单栏下面的选择个案,在选择框中包含五中方法

1)所有个案:即选择所有个案

2)如果条件满足:可以输入函数进行条件判断来指定个案

3)随机个案样本:可以根据随机百分比来获取,也可以指定要获取的个案数和从哪个个案开始来获取

4)基于时间或个案范围:可以指定观测值,指定第一个个案和最后一个个案

5)使用过滤变量:可以指定某个过滤的变量

我们选择随机个案样本,选择样本大小为20%:

在数据窗口中会生成一个filter_$变量,1表示被选中,0表示没有被选中,左侧的序号也会进行标识。

相关资料链接下载地址:https://download.****.net/download/qq_37050993/10615544