假设我拥有在不同状态下发生的大量交易的数据
State Cost
AK, 70
AK, 75
AK, 10
IL, 20
IL, 1050
IL, 235
etc...
如何压缩我的数据,以便我只查看每个州的总费用?我只能通过编写python脚本来压缩这些数据来提出解决方案,但似乎R应该能够支持这种操作。
State Cost
AK, 155
IL, 1305
etc...
非常感谢任何想法。
答案 0 :(得分:1)
library("dplyr")
options(digits=4)
StatsByState <- group_by(Your.df, State)
summarise(StatsByState, Sum = sum(Cost), Mean = mean(Cost), StDev = sd(Cost))
options(digits=7)
State Sum Mean StDev
1 AK 155 51.67 36.17
2 IL 1040 346.67 565.80
3 NE 720 240.00 242.49