如何将数据框的一列分成另一列?

时间:2012-10-22 14:10:19

标签: r count

我想将一列与另一列分开以获得每人的时间我该怎么做?我找不到任何关于如何划分的内容。

以下是我想要使用的一些数据

     min    count2.freq
263807.0    1582
196190.5    1016
586689.0    3479

最后,我想添加第三列,其中包含min / count2.freq

中的数字

例如263808.0/1582 = 166.75

2 个答案:

答案 0 :(得分:40)

有很多方法可以做到这一点。问题是如何使R知道你想要分割的变量的位置。

假设

d <- read.table(text = "263807.0    1582
196190.5    1016
586689.0    3479
")
names(d) <- c("min", "count2.freq")
> d
       min count2.freq
1 263807.0        1582
2 196190.5        1016
3 586689.0        3479

我的首选方式

要将所需的分区添加为第三个变量,我将使用transform()

> d <- transform(d, new = min / count2.freq)
> d
       min count2.freq      new
1 263807.0        1582 166.7554
2 196190.5        1016 193.1009
3 586689.0        3479 168.6373

基本R路

如果在函数中执行此操作(即您正在编程),那么最好避免上面显示的糖和索引。在这种情况下,任何这些都可以做你想要的事情

## 1. via `[` and character indexes
d[, "new"] <- d[, "min"] / d[, "count2.freq"]

## 2. via `[` with numeric indices
d[, 3] <- d[, 1] / d[, 2]

## 3. via `$`
d$new <- d$min / d$count2.freq

所有这些都可以在提示符下使用,但更容易阅读:

d <- transform(d, new = min / count2.freq)

d$new <- d$min / d$count2.freq ## or any of the above examples

希望你像我一样思考,第一个版本更好; - )

我们在编程时不使用tranform() et al的语法糖的原因是因为他们如何进行评估(寻找命名变量)。在顶层(在提示时,以交互方式工作)transform()等工作得很好。但是在函数调用中或在apply()函数系列之一的调用中,它们可以并且经常会中断。

同样,小心使用数字索引(上面## 2.);如果更改数据的顺序,则会选择错误的变量。

如果您不需要更换,首选方式

如果您只想进行除法(而不是将结果插回到数据框中,请使用with(),这样我们就可以隔离您要评估的简单表达式

> with(d, min / count2.freq)
[1] 166.7554 193.1009 168.6373

这又是比同等的

更清晰的代码
> d$min / d$count2.freq
[1] 166.7554 193.1009 168.6373

因为它明确指出“使用d,执行代码min / count2.freq。您的偏好可能与我的不同,所以我展示了所有选项。

答案 1 :(得分:1)

Hadley Wickham

  

dplyr

在数据争用的情况下,

包总是更省钱。 要将所需的分区添加为第三个变量,我将使用mutate()

d <- mutate(d, new = min / count2.freq)