我正在尝试在矩阵中插入NA值,该矩阵包含前两个具有坐标(x和y)的列和24个具有时间相关值的列。因此,我设置了for循环,该循环应基于每行至少两个值(不包括坐标)对每行的NA值进行插值。 所以我想我的问题是,我的for循环不会跳到下一行还是总是跳到第一个单元格?
我在Windows 10上使用R-Studio版本1.2.1335和R版本3.4.4
完整的矩阵直到“ layer.24”行和492528列
x y layer.1 layer.2 layer.3 layer.4
[1,] 562201.9 5723273 8148 7031 7219 5824
[2,] 562463.6 5723273 NA NA NA NA
[3,] 562725.3 5723273 4188 NA NA 4200
[4,] 562987.0 5723273 4237 NA NA NA
[5,] 563248.7 5723273 3468 NA 5277 4888
[6,] 563510.5 5723273 3310 NA 5277 5095
for (i in 1:length(matrix[,1]))
{
if (sum(is.na(matrix[i,3:26])>1))
{matrix[i,3:26] = imputeTS::na.interpolation(matrix[i,3:26])}
}
因此,我希望得到一个插值矩阵,但本示例中的第4行除外。
答案 0 :(得分:3)
我们可以按如下方式工作(首先转换为data.frame
(此处命名为df
):
to_replace <- df[apply(df, 1,function(x) sum(is.na(x))>2),]
t(apply(to_replace,1,function(x) imputeTS::na.interpolation(x)))
x y layer.1 layer.2 layer.3 layer.4
2 562463.6 5723273 5723273 5723273 5723273 5723273
4 562987.0 5723273 4237 4237 4237 4237
您可以将值存储回to_replace
。
如果您希望拥有少于两个NA
的用户,则:
to_replace <- df[apply(df, 1,function(x) sum(is.na(x))<2),]
t(apply(to_replace,1,function(x) imputeTS::na.interpolation(x)))
x y layer.1 layer.2 layer.3 layer.4
1 562201.9 5723273 8148 7031.0 7219 5824
5 563248.7 5723273 3468 4372.5 5277 4888
6 563510.5 5723273 3310 4293.5 5277 5095