Question

我正在研究一个名为crime的DataFrame，它看起来像这样：

X X.1 date              year  month day hour minute second
1 1 2008-08-31 20:47:00 2008     8  31   20     47      0
2 2 2008-09-01 00:45:00 2008     9   1    0     45      0
3 3 2008-09-01 03:00:00 2008     9   1    3      0      0
4 4 2008-09-09 07:46:00 2008     9   9    7     46      0

X和X.1属性是指已实施的犯罪。犯罪1，犯罪2，犯罪3等，都是独特的价值。也就是说，如果此数据集报告了30起犯罪，则这些属性从1一直上升到30。

我想做的是创建一个新的DataFrame，它的列反映了每个月和每年的计数。看起来像这样：

crimes  year  month 
10      2008     8
17      2008     9
24      2008     10
41      2008     11

我该怎么做？

Answer 1

您可以在dplyr中使用group_by。

library(dplyr)

crime %>% group_by(year, month) %>% summarize(crimes = n())

根据R中的其他两列对列中的值进行计数

1 个答案: