我尝试在此数据集中添加额外列以计算文件中存在的pat_id的时间(即hse有多少约会),感谢您的帮助。
pat_id; date; result
p123; 2015-4-5; ok
p02; 2015-6-8; ;
p123; 2015-8-8;miss
和期望的输出:
pat_id; total_appt; date; result
p123; 2; 2015-4-5; ok
p02; 1; 2015-6-8; ;
p123; 2; 2015-8-8;miss
非常感谢你能帮助我。
答案 0 :(得分:1)
您可以使用data.table,假设您的数据集是命名数据:
session.get()
答案 1 :(得分:0)
让我们说你的原始数据框是" df"
countDf = data.frame(table(df$pat_id))
names(countDf) = c("pat_id","count")
df_with_count = merge(df,countDf,by="pat_id")