我有一个人/时期的数据集,其中包含我们在此期间对地址进行地理编码的能力的指标。像
person start_dt end_dt geo_quality
-------------------------------------------------
billy ray 01-dec-2000 14-jun-2004 exact
billy ray 15-jun-2004 31-aug-2005 street center
billy ray 01-may-2012 12-feb-2014 zip center
mortimer 04-jun-1989 06-dec-2018 exact
randolph 01-jan-1992 05-may-2005 zip center
我想描述我的数据集(其中包含约5,000人的数据)的地理编码/期间的时间范围和质量。
我正在绘制一个图形,其中X轴是日期,Y轴是人(必须用b / c标签来标记太多的人),而每个人的线条只是一个堆在另一个上。线条的颜色表示地理编码的质量。线的长度表示我们随时间推移为该人覆盖的范围。如果覆盖范围存在差距,那么我们的差距就很大。我认为这有点像意大利面条图,只是y轴是(很荒谬地)是绝对的。
有这样的事情吗?如果是,它叫什么&如何制作(请使用SAS,R或python)?
如果否,那么描述此数据的好方法是什么?我的用户不喜欢此功能,这表明随着时间的推移,有N个人的地理编码质量不佳: