说,我有一个如下数据框,有三列。我想创建第四列,其值是前两列中放在一起的数量之和
迭代版
col1 = c(1,1,1,0,0)
col2 = c(1,0,0,0,1)
col3 = c(0,1,1,1,0)
df = data.frame(col1,col2,col3)
df$col4 = 0;
for(i in 1:nrow(df))
{
print(i)
countone = 0
for(j in 1:2)
{
if(df[i,j] == 1)
{
countone = countone + 1;
}
}
df[i,4] = countone
}
输入
col1 col2 col3
1 1 1 0
2 1 0 1
3 1 0 1
4 0 0 1
5 0 1 0
预期产出
> df
col1 col2 col3 col4
1 1 1 0 2
2 1 0 1 1
3 1 0 1 1
4 0 0 1 0
5 0 1 0 1
答案 0 :(得分:1)
df$col4 <- rowSums(df[,1:2])
这被称为行和。
并且不需要初始化行:df$col4 = 0
。
(此代码有效,因为我们获得的条目只能是0或1.如果需要,适用于更通用代码的内容为rowSums(df[,1:2]==1)
,... na.rm = T
。