For循环不使用r插值矩阵中的缺失值

时间:2019-07-04 17:48:36

标签: r for-loop matrix interpolation na

我正在尝试在矩阵中插入NA值,该矩阵包含前两个具有坐标(x和y)的列和24个具有时间相关值的列。因此,我设置了for循环,该循环应基于每行至少两个值(不包括坐标)对每行的NA值进行插值。 所以我想我的问题是,我的for循环不会跳到下一行还是总是跳到第一个单元格?

我在Windows 10上使用R-Studio版本1.2.1335和R版本3.4.4

完整的矩阵直到“ layer.24”行和492528列

         x         y            layer.1   layer.2   layer.3   layer.4  
    [1,] 562201.9 5723273       8148      7031      7219      5824    
    [2,] 562463.6 5723273       NA        NA        NA        NA        
    [3,] 562725.3 5723273       4188      NA        NA        4200        
    [4,] 562987.0 5723273       4237      NA        NA        NA         
    [5,] 563248.7 5723273       3468      NA        5277      4888    
    [6,] 563510.5 5723273       3310      NA        5277      5095    

for (i in 1:length(matrix[,1]))
{
if (sum(is.na(matrix[i,3:26])>1)) 
{matrix[i,3:26] = imputeTS::na.interpolation(matrix[i,3:26])}
}        

因此,我希望得到一个插值矩阵,但本示例中的第4行除外。

1 个答案:

答案 0 :(得分:3)

我们可以按如下方式工作(首先转换为data.frame(此处命名为df):

  to_replace <- df[apply(df, 1,function(x) sum(is.na(x))>2),]
   t(apply(to_replace,1,function(x) imputeTS::na.interpolation(x)))
             x       y layer.1 layer.2 layer.3 layer.4
    2 562463.6 5723273 5723273 5723273 5723273 5723273
    4 562987.0 5723273    4237    4237    4237    4237

您可以将值存储回to_replace

如果您希望拥有少于两个NA的用户,则:

to_replace <- df[apply(df, 1,function(x) sum(is.na(x))<2),]
 t(apply(to_replace,1,function(x) imputeTS::na.interpolation(x)))
         x       y layer.1 layer.2 layer.3 layer.4
1 562201.9 5723273    8148  7031.0    7219    5824
5 563248.7 5723273    3468  4372.5    5277    4888
6 563510.5 5723273    3310  4293.5    5277    5095