我想将一列与另一列分开以获得每人的时间我该怎么做?我找不到任何关于如何划分的内容。
以下是我想要使用的一些数据
min count2.freq
263807.0 1582
196190.5 1016
586689.0 3479
最后,我想添加第三列,其中包含min / count2.freq
例如263808.0/1582 = 166.75
答案 0 :(得分:40)
有很多方法可以做到这一点。问题是如何使R知道你想要分割的变量的位置。
假设
d <- read.table(text = "263807.0 1582
196190.5 1016
586689.0 3479
")
names(d) <- c("min", "count2.freq")
> d
min count2.freq
1 263807.0 1582
2 196190.5 1016
3 586689.0 3479
要将所需的分区添加为第三个变量,我将使用transform()
> d <- transform(d, new = min / count2.freq)
> d
min count2.freq new
1 263807.0 1582 166.7554
2 196190.5 1016 193.1009
3 586689.0 3479 168.6373
如果在函数中执行此操作(即您正在编程),那么最好避免上面显示的糖和索引。在这种情况下,任何这些都可以做你想要的事情
## 1. via `[` and character indexes
d[, "new"] <- d[, "min"] / d[, "count2.freq"]
## 2. via `[` with numeric indices
d[, 3] <- d[, 1] / d[, 2]
## 3. via `$`
d$new <- d$min / d$count2.freq
所有这些都可以在提示符下使用,但更容易阅读:
d <- transform(d, new = min / count2.freq)
或
d$new <- d$min / d$count2.freq ## or any of the above examples
希望你像我一样思考,第一个版本更好; - )
我们在编程时不使用tranform()
et al的语法糖的原因是因为他们如何进行评估(寻找命名变量)。在顶层(在提示时,以交互方式工作)transform()
等工作得很好。但是在函数调用中或在apply()
函数系列之一的调用中,它们可以并且经常会中断。
同样,小心使用数字索引(上面## 2.
);如果更改数据的顺序,则会选择错误的变量。
如果您只想进行除法(而不是将结果插回到数据框中,请使用with()
,这样我们就可以隔离您要评估的简单表达式
> with(d, min / count2.freq)
[1] 166.7554 193.1009 168.6373
这又是比同等的
更清晰的代码> d$min / d$count2.freq
[1] 166.7554 193.1009 168.6373
因为它明确指出“使用d
,执行代码min / count2.freq
。您的偏好可能与我的不同,所以我展示了所有选项。
答案 1 :(得分:1)
Hadley Wickham
在数据争用的情况下,dplyr
包总是更省钱。
要将所需的分区添加为第三个变量,我将使用mutate()
d <- mutate(d, new = min / count2.freq)