我正在研究EMR系统中的数据集,该数据集可以追溯到大约5年之前。目的是确定治疗时间。在下面的示例中,我目前仅选择了重要的变量。该ID对于每个个体受伤部位(而不是每个患者)都是唯一的。具有3种不同伤害的患者的档案中将有3个ID号。但是,如果受伤he愈,然后在将来的任何时间重新开放,则视为再次发生。这就是棘手的地方。主治医师应该在他们第一次看到这种伤害时选择“初始”或“再次发生”的就诊类型。此外,该状态仅在第一次看到伤害时才为“初始”状态。第一次访问后,访问类型应为“后续”,状态应为“正在恢复”,“相同”,“拒绝”或“已恢复”。正如您在下面看到的那样,这并不总是发生,并且状态比访问类型框更准确。我可以检查并选择最早出现的初始状态,但这不包括我需要在3/15/18再次发生的情况。有什么方法可以在我用来选择“ Initial”的第一个实例的代码中构建某种逻辑,即如果这是一次重复发生(无论是否选择了dr再次发生),R都不会将其删除?如果从上次访问到最初的R之间有4周的间隔,那该怎么办? 第二个问题。 受伤he愈后,医生并不总是将状态更改为“ he愈”。我可以使用上次已知的访问作为治愈日期,但是再次出现时,这还是有问题的。
很显然,这是确保drs正确记录的最简单解决方案,但这对我已经拥有的多年数据没有帮助。
ID Date visit type status
1 11/16/2017 Initial Initial
1 11/18/2018 Initial Initial
1 11/20/2017 Subsequent healing
1 11/25/2017 Subsequent healing
1 12/2/2017 Subsequent healing
1 3/15/2018 Reoccurrence initial
1 3/20/2018 Subsequent healing
1 3/25/2018 Subsequent healed