对于循环代码,是否有任何无错误且更快的替代方法?
for(i in 1:length(Mergedf))
{if (Mergedf[i,"z"]==0)
{Mergedf[i,"cntry_origin"] <-Mergedf[i,"V2"]}
print(Mergedf[i,"cntry_origin"])
}
Mergdf如果是复杂逻辑的结果。
由于
答案 0 :(得分:2)
您尝试做的是一个非常基本的R
&#39;子集,并取代&#39;问题。如果您习惯使用VBA
之类的语言进行书写,那么for
循环似乎很自然。但是,R
&#34;擅长&#34; (双关语意思是)能够对这些类型的操作进行矢量化,使其能够一步完成,而无需遍历整个数据集。
此处的代码全部用 Base R
编写考虑示例数据
set.seed(1)
MergedDF <- data.frame("z" = c(0,1,2,3,0,1,2,3),
"cntry_origin" = letters[1:8],
"V2" = rnorm(8,0,1),
stringsAsFactors = FALSE)
# z cntry_origin V2
# 1 0 a -0.6264538
# 2 1 b 0.1836433
# 3 2 c -0.8356286
# 4 3 d 1.5952808
# 5 0 e 0.3295078
# 6 1 f -0.8204684
# 7 2 g 0.4874291
# 8 3 h 0.7383247
过滤给定条件的data.frame
获取z == 0
MergedDF[MergedDF$z == 0, ]
# z cntry_origin V2
# 1 0 a -0.6264538
# 5 0 e 0.3295078
选择特定列
要获取cntry_origin
列z==0
中的所有值,有两个等效语句:
MergedDF[MergedDF$z == 0, "cntry_origin"]
# [1] "a" "e"
## Or
MergedDF[MergedDF$z == 0, ]$cntry_origin
# [1] "a" "e"
要获取V2
z==0
列的值
MergedDF[MergedDF$z == 0, ]$V2
#[1] -0.6264538 0.3295078
用不同的值替换一列
要将cntry_origin
列替换为V2
,其中z==0
只需将其分配到另一个
MergedDF[MergedDF$z == 0, ]$cntry_origin <- MergedDF[MergedDF$z == 0, ]$V2
MergedDF
# z cntry_origin V2
# 1 0 -0.626453810742332 -0.6264538
# 2 1 b 0.1836433
# 3 2 c -0.8356286
# 4 3 d 1.5952808
# 5 0 0.329507771815361 0.3295078
# 6 1 f -0.8204684
# 7 2 g 0.4874291
# 8 3 h 0.7383247
等效的data.table
代码将是
library(data.table)
setDT(MergedDF)[z==0, cntry_origin := V2]