我想汇总和计算我的数据集中某个日期的特殊疾病的频率。 (我不使用重复,因为我想要所有行,而不仅仅是重复的行)
我的原始数据集如下:
id dat kinds kind
AE00302 2011-11-20 valv 1
AE00302 2011-10-31 vask 2
(当然我的data.frame要大得多)
我试试这个:
xagg<-aggregate(kind~id+dat+kinds,subx,length)
names(xagg)<-c("id","dat","kinds","kindn")
并获得:
id dat kinds kindn
AE00302 2011-10-31 valv 1
AE00302 2011-11-20 vask 1
我想知道为什么R在'date'上出错了。 '种类'栏。
有人有想法吗?
答案 0 :(得分:0)
我仍然不知道为什么。 但我发现,聚合出错了,因为我不使用聚合的列。
因此,这些步骤为我解决了这个问题:
# 1st step: reduce the data.frame to only the needed columns
# 2nd Step: aggregate the reduced data.frame
# 3rd Step: merge aggregated data to reduced dataset
# 4th step: remove duplicated rows from reduced dataset (if they occur)
# 5th step: merge reduced dataset without dublicated data to original dataset
如果聚合的data.frame中存在重复的数据集,则可能会出现问题。
感谢您的所有帮助,问题以及尝试解决我的问题!
elchvonoslo