【文件属性】:
文件名称:过滤不一致的数据-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2021-06-14 22:52:43
RapidMiner
图 7.12 设置过滤条件
第四步:过滤不一致数据
在 Twitter 数据列中,有一个为“99”的不匹配数据,我们打算要把它替换为“N”,这
里我们调用“Replace”操作符,在设置参数里面,我们选择“single”单一属性,atttibute
属性选择“Twitter”,“replace what”选择“99”,replace by 填为“N”。参见图 7.13。
图 7.13 过滤不一致的数据
第五步:数据采样约简
在数据挖掘过程中,有时候数据集的数据内容太多,我们想取一半的数据进行模型的训
练,我们使用“Sample”采样操作符,在参数设置中我们选择“relative”相对成比例的采样