Matlab 数据补全方法

时间:2024-03-04 15:40:46
fillmissing

填充缺失值

F = fillmissing(A,method)                         % 插值填充
案例如下:

x = [-4*pi:0.1:0, 0.1:0.2:4*pi];      % 定义非均匀采样点向量,并计算这些点上的正弦函数。
A = sin(x);
A(A < 0.75 & A > 0.5) = NaN;          % 将 NaN 值插入 A 中。
% 使用线性插值填充缺失数据,并返回填充的向量 F 和逻辑向量 TF。TF 项中的值 1 (true) 对应于 F 中的填充值。
[F,TF] = fillmissing(A,\'linear\',\'SamplePoints\',x);
plot(x,A,\'.\', x(TF),F(TF),\'o\')  % 绘制原始数据和填充的数据。
xlabel(\'x\');
ylabel(\'sin(x)\')
legend(\'Original Data\',\'Filled Missing Data\')

填充方法还包括:

方法说明
\'previous\' 上一个非缺失值
\'next\' 下一个非缺失值
\'nearest\' 距离最近的非缺失值
\'linear\' 相邻非缺失值的线性插值(仅限数值、duration 和 datetime 数据类型)
\'spline\' 分段三次样条插值(仅限数值、duration 和 datetime 数据类型)
\'pchip\' 保形分段三次样条插值(仅限数值、duration 和 datetime 数据类型)
\'makima\' 修正 Akima 三次 Hermite 插值(仅限数值、duration 和 datetime 数据类型)

 

F = fillmissing(A,movmethod,window)     % 滑动填充

案例如下:

% 创建样本点向量 x 和包含缺失值的数据向量 A。
x = linspace(0,10,200); 
A = sin(x) + 0.5*(rand(size(x))-0.5); 
A([1:10 randi([1 length(x)],1,50)]) = NaN; 
% 使用窗口长度为 10 的移动中位数替换 A 中的 NaN 值,并绘制原始数据和填充的数据。
F = fillmissing(A,\'movmedian\',10);  
plot(x,F,\'r.-\',x,A,\'b.-\') 
legend(\'Filled Missing Data\',\'Original Data\')

注意:当使用\'movmedian\'方法填充数据时,窗口长度为2并不能有效填充数据,原始数据中的NaN将被保留

填充方法还包括:

方法说明
\'movmean\' 窗口长度为 window 的移动均值(仅限数值数据类型)
\'movmedian\' 窗口长度为 window 的移动中位数(仅限数值数据类型)

特别感谢:

李果(大凉茶)

参考文献:

https://ww2.mathworks.cn/help/matlab/ref/fillmissing.html