R语言缺失值信息处理

时间:2023-12-05 16:30:26

mean(!is.na(mat))可以计算数据完整度(没有缺失值的)

mean(!is.na(mat))>0.9,90%完整可以使用

# 缺失值的位置研究
as.vector(attributes(na.omit(mat))$na.action)

which(rowSums(is.na(mat))!=0)

which(complete.cases(mat)==F)

# 缺失数据的图形可视化VIM包

library(VIM)

aggr(mat,numbers=T,prop= F)

matrixplot(mat)

# 相关性探索

mat

mat_NA<-mat[,which(complete.cases(t(mat))==F)]
mat_NA<-abs(is.na(mat_NA))
cor(mat_NA)