另类更高效的循环选项

时间:2016-03-25 04:37:00

标签: r for-loop foreach apply

对于循环代码,是否有任何无错误且更快的替代方法?

for(i in 1:length(Mergedf)) 
{if (Mergedf[i,"z"]==0) 
{Mergedf[i,"cntry_origin"] <-Mergedf[i,"V2"]} 
  print(Mergedf[i,"cntry_origin"])
}

Mergdf如果是复杂逻辑的结果。

由于

1 个答案:

答案 0 :(得分:2)

您尝试做的是一个非常基本的R&#39;子集,并取代&#39;问题。如果您习惯使用VBA之类的语言进行书写,那么for循环似乎很自然。但是,R&#34;擅长&#34; (双关语意思是)能够对这些类型的操作进行矢量化,使其能够一步完成,而无需遍历整个数据集。

此处的代码全部用 Base R

编写

考虑示例数据

set.seed(1)
MergedDF <- data.frame("z" = c(0,1,2,3,0,1,2,3),
                       "cntry_origin" = letters[1:8],
                       "V2" = rnorm(8,0,1),
                       stringsAsFactors = FALSE)

#   z cntry_origin         V2
# 1 0            a -0.6264538
# 2 1            b  0.1836433
# 3 2            c -0.8356286
# 4 3            d  1.5952808
# 5 0            e  0.3295078
# 6 1            f -0.8204684
# 7 2            g  0.4874291
# 8 3            h  0.7383247

过滤给定条件的data.frame

获取z == 0

所有的行
MergedDF[MergedDF$z == 0, ]

#   z cntry_origin         V2
# 1 0            a -0.6264538
# 5 0            e  0.3295078

选择特定列

要获取cntry_originz==0中的所有值,有两个等效语句:

MergedDF[MergedDF$z == 0, "cntry_origin"]
# [1] "a" "e"

## Or
MergedDF[MergedDF$z == 0, ]$cntry_origin
# [1] "a" "e" 

要获取V2

z==0列的值
MergedDF[MergedDF$z == 0, ]$V2
#[1] -0.6264538  0.3295078

用不同的值替换一列

要将cntry_origin列替换为V2,其中z==0只需将其分配到另一个

MergedDF[MergedDF$z == 0, ]$cntry_origin <- MergedDF[MergedDF$z == 0, ]$V2

MergedDF

#   z       cntry_origin         V2
# 1 0 -0.626453810742332 -0.6264538
# 2 1                  b  0.1836433
# 3 2                  c -0.8356286
# 4 3                  d  1.5952808
# 5 0  0.329507771815361  0.3295078
# 6 1                  f -0.8204684
# 7 2                  g  0.4874291
# 8 3                  h  0.7383247

等效的data.table代码将是

library(data.table)
setDT(MergedDF)[z==0, cntry_origin := V2]