如何在matlab中进行数据的预处理
1、加载数据首先加载 count.dat 中的数据:load count.dat这个 24×3 数组 count 包含三个十字路口(列)在一天中的每小时流量统计(行)。
2、缺失数据MATLAB NaN(非数字)值通常用于表示缺岳赎祝浦失数据。通过 NaN 值,缺失数据的变量可以维护其结构体 -在本示例中,即在所有三个十字路口中的索引都是一致的 24×1 向量。使用 isnan 函数检查第三个十字路口的数据是否存在 NaN 值:c3 = count(:,3); % Data at intersection 3c3NaNCount = sum(isnan(c3))


7、在绘图中,第 20 个小时的 NaN 值出现间隔。这种对 NaN 值的处理方式是 MATLAB 绘图函数所特有的。
8、噪音数据围绕预期值显示随机变化。您可能希望在构建模型之前对数据进行平滑处理,以便显示其主要特点。平滑处理应当以下面两个基眺螗熨膣本假定为基础:- 预测变量(时间)和响应(流量)之间的关系平稳。- 由于已减少噪音,因此平滑算法生成比预期值更好的估计值。使用 MATLAB convn 函数对数据应用简单移动平均平滑法:span = 3; % Size of the averaging windowwindow = ones(span,1)/span;smoothed_c3m = convn(c3m,window,'same');h = plot(smoothed_c3m,'ro-');legend('Data','Smoothed Data')

11、平滑数据在以上绘图的基础上发生了偏移。带有 'same' 参数的 convn 返回卷积的中间部分,其长度与数据相同。filter 返回卷积的开头,其长度与数据相同。否则算法相同。平滑处理可估计预测变量的每个值的响应值分布的中心。它使许多拟合算法的基本假定无效,即预测器的每个值的错误彼此独立。相应地,您可以使用平滑数据确定模型,但应避免使用平滑数据拟合模型。