如何可视化时间段数据集

时间:2018-12-06 20:35:50

标签: data-visualization

我有一个人/时期的数据集,其中包含我们在此期间对地址进行地理编码的能力的指标。像

person     start_dt     end_dt      geo_quality
-------------------------------------------------
billy ray  01-dec-2000  14-jun-2004 exact
billy ray  15-jun-2004  31-aug-2005 street center
billy ray  01-may-2012  12-feb-2014 zip center
mortimer   04-jun-1989  06-dec-2018 exact
randolph   01-jan-1992  05-may-2005 zip center

我想描述我的数据集(其中包含约5,000人的数据)的地理编码/期间的时间范围和质量。

我正在绘制一个图形,其中X轴是日期,Y轴是人(必须用b / c标签来标记太多的人),而每个人的线条只是一个堆在另一个上。线条的颜色表示地理编码的质量。线的长度表示我们随时间推移为该人覆盖的范围。如果覆盖范围存在差距,那么我们的差距就很大。我认为这有点像意大利面条图,只是y轴是(很荒谬地)是绝对的。

有这样的事情吗?如果是,它叫什么&如何制作(请使用SAS,R或python)?

如果否,那么描述此数据的好方法是什么?我的用户喜欢此功能,这表明随着时间的推移,有N个人的地理编码质量不佳:

panel plot of n(people) over time

0 个答案:

没有答案