我正在研究一个名为crime
的DataFrame,它看起来像这样:
X X.1 date year month day hour minute second
1 1 2008-08-31 20:47:00 2008 8 31 20 47 0
2 2 2008-09-01 00:45:00 2008 9 1 0 45 0
3 3 2008-09-01 03:00:00 2008 9 1 3 0 0
4 4 2008-09-09 07:46:00 2008 9 9 7 46 0
X
和X.1
属性是指已实施的犯罪。犯罪1,犯罪2,犯罪3等,都是独特的价值。也就是说,如果此数据集报告了30起犯罪,则这些属性从1一直上升到30。
我想做的是创建一个新的DataFrame,它的列反映了每个月和每年的计数。看起来像这样:
crimes year month
10 2008 8
17 2008 9
24 2008 10
41 2008 11
我该怎么做?
答案 0 :(得分:0)
您可以在dplyr中使用group_by。
library(dplyr)
crime %>% group_by(year, month) %>% summarize(crimes = n())