Question

我有临床试验的时间序列数据，其中患者在治疗序列内进行治疗。患者最多可以有10个序列。每个序列都有一个开始和结束日期。此外，患者在第一个序列开始之前具有登记日期，并且在最后一个序列结束之后进行最后一次观察。

我遇到的问题是某些日期完全缺失（NA），有些日期部分缺失，月份和日期或仅缺少日期（“9999-99-99”，“2010-01-99 “或”2010-99-99“）。现在的挑战是提出一种方法来使用尽可能多的可用信息来估算缺失的日期，而不会产生难以置信的价值：治疗序列应该只在注册后开始;先前的治疗顺序必须在下次开始之前结束，等等。

我不是在寻找一个完整的解决方案 - 我只是不知道应该用什么类型的方法来解决这个问题。我很感激你对此的想法。

谢谢。

一些数据来说明问题：

time.df= data.frame(id = c(rep("A",4),rep("B",3),rep("C",2)),
               enrolled = c(rep("2010-01-01",4),rep("2010-03-99",3),rep("2010-02-99",2)),
               last.obs = c(rep("2015-03-28",4),rep("2013-99-99",3),rep("2012-12-12",2)),
               start = c("2010-04-22","2011-11-99","2014-99-99","2014-12-01",
                     "2010-03-20","2011-11-12","2013-08-14",
                     "9999-99-99","9999-99-99"),
               end = c("2010-06-28","2013-04-12","2014-06-01","2015-03-99",
                     "9999-99-99","2012-07-08","2013-12-24",
                     "9999-99-99","9999-99-99"))

将部分缺失的日期归结为

0 个答案: