Matlab剔除多变量异常数据,异常数据用0代替。
1、首先将样本数据读入到wt矩阵。
程序如下:
wt=xlsread('样本数据.xlsx'); %读入样本数据表格
可以打开工作区的变量表查看是否已经读入数据,下面正常读入了数据。

2、接着计算样本数据的大小 n行 p列
[n,p]=size(wt);
运行结果如下图所示。

3、再依次将样本数据表中变量一列一列赋值给c_wt,计算平均值,当前值减去平均值(样本数据偏差),计算标准差, 当前值减去平均值(样本数据偏差)的绝对值,与3倍标准差比较,若大于则代表数据异常,将异常值赋值为0,将剔除异常数据后的变量依次一列一列填入ty_wt。
程序代码如下:
for c=1:p
c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt
c_wtmean=mean(c_wt); %计算平均值
j=1;
for i=1:n
vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差)
stdcwt=std(c_wt); % 计算标准差
if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句
c_wt(i,:)=0; % 将异常值赋值为0
c_tbj(j,c)=i; %标记异常数据的坐标
j=j+1;
end
end
ty_wt(:,c) = c_wt; %将剔除异常数据后的变量依次一列一列填入ty_wt
end
运行结果如下图所示。

4、 然后将剔除异常后数据ty_wt写入到剔除异常后数据Excel表格。
程序如下:
xlswrite('剔除异常后数据.xlsx',ty_wt);
运行结果如下图所示。

5、完整程序代码及截图如下:
%*******剔除异常数据,对异常数据用0代替。*******************************
%**********采用统计识别法,根据统计学规律给定一个置信概率,并确定置信限,采用拉以达准则******************
wt=xlsread('样本数据.xlsx'); %读入样本数据
[n,p]=size(wt); %求样本数据的大小 n行,p列
for c=1:p
c_wt=wt(:,c); %依次将样本数据表中变量一列一列赋值给c_wt
c_wtmean=mean(c_wt); %计算平均值
j=1;
for i=1:n
vi(i,:)=c_wt(i,:)-c_wtmean; % 当前值减去平均值(样本数据偏差)
stdcwt=std(c_wt); % 计算标准差
if abs(vi(i,:))>3*stdcwt % 当前值减去平均值(样本数据偏差)的绝对值与3倍标准差比较,若大于则代表数据异常,执行if后面语句
c_wt(i,:)=0; % 将异常值赋值为0
c_tbj(j,c)=i; %标记异常数据的坐标
j=j+1;
end
end
ty_wt(:,c) = c_wt; %将提出异常数据后的变量依次一列一列填入ty_wt
end
xlswrite('剔除异常后数据.xlsx',ty_wt); % 将剔除异常后数据ty_wt赋值给剔除异常后数据表格
%**************************************************************************
