你好我在R中有一个数据帧,相当大的600行/观察
一列是患者ID,不是数字形式,例如ju89,ju87,所以它是一个因子列
一列是1/0,其中1表示缓解0表示不缓解
一栏是诊断时间
现在,从诊断开始患者从1到0,0到0,0到1或1到1
我想在数据框中添加一列 1当患者缓解0时
2当确切的患者有1例缓解时,最后一次他有0或OR有1缓解,最后一次他有1缓解或1缓解,这是他的第一次观察
3当患者缓解1次,最后2次或更多次缓解1次
我在plyr中用暨总和做了这个,但它不适合我想做的事情或者不太清楚如何适应
数据框已经排序,以便患者ID彼此相邻,并且每个患者从诊断开始的时间随着您读取数据框而增加
由于机密性,我无法提供数据框,但此处澄清事情是什么
缓解时间从diag patientid ...(其他变量)
这是我开始使用的数据:
patientId timefromdiagnosis remission
ju67 1.2 1
ju67 1.6 0
ju67 3 0
ju88 1.5 1
ju88 2 1
ju23 1.9 1
ju23 5 0
以下是我想要的,疾病阶段是我想要的专栏:
patientId timefromdiagnosis remission disease stage
ju67 1.2 1 2
ju67 1.6 0 1
ju67 3 0 1
ju88 1.5 1 2
ju88 2 1 2
ju23 1.9 1 2
ju23 5 0 1
ju38 1.7 1 2
ju38 1.9 1 2
ju38 3 1 3
ju38 4 1 3
ju38 5 0 1
注意患者ju38如何达到3,因为他已连续3次缓解,包括现在的时间(缓解最后两次和现在),然后他停留在3,因为他只是有另一种缓解,然后他进入疾病阶段1,因为他缓解为0。
患者ju88在t = 2时缓解并且在上次t = 1.5时有缓解,但这只是连续两次缓解,包括t = 2,因此他处于疾病阶段2 病人ju23在t = 1.9,缓解1,这是对他的第一次观察,因此他满足了疾病阶段2的批评,如果他的缓解率为0,他将处于疾病阶段1