带有公式和日期变量的聚合data.frame出错

时间:2015-09-28 10:32:42

标签: r dataframe aggregate formula

我想汇总和计算我的数据集中某个日期的特殊疾病的频率。 (我不使用重复,因为我想要所有行,而不仅仅是重复的行)

我的原始数据集如下:

     id        dat   kinds kind
AE00302 2011-11-20    valv    1
AE00302 2011-10-31    vask    2

(当然我的data.frame要大得多)

我试试这个:

xagg<-aggregate(kind~id+dat+kinds,subx,length)
names(xagg)<-c("id","dat","kinds","kindn")

并获得:

     id        dat kinds kindn
AE00302 2011-10-31  valv     1
AE00302 2011-11-20  vask     1

我想知道为什么R在'date'上出错了。 '种类'栏。

有人有想法吗?

1 个答案:

答案 0 :(得分:0)

我仍然不知道为什么。 但我发现,聚合出错了,因为我不使用聚合的列。

因此,这些步骤为我解决了这个问题:

# 1st step: reduce the data.frame to only the needed columns
# 2nd Step: aggregate the reduced data.frame
# 3rd Step: merge aggregated data to reduced dataset
# 4th step: remove duplicated rows from reduced dataset (if they occur)
# 5th step: merge reduced dataset without dublicated data to original dataset

如果聚合的data.frame中存在重复的数据集,则可能会出现问题。

感谢您的所有帮助,问题以及尝试解决我的问题!

elchvonoslo