我有一个一直需要连接的折线图(x代表日期,y代表该日期的汽车租赁数量),因为这些值都是有效的-每个日期始终至少有一个汽车租赁。线路不应该连接,而是在两个有效值/点之间形成间隙的唯一时间是两个连续的日期相距太远。我必须找出最好的算法,以了解这两个``相距较远''的含义,并根据这些日期(或某些日期)设置一个参数。我不知道所有可能的日期组合,但我认为它们可以是任何东西:
有没有解决这种问题的标准方法?
答案 0 :(得分:0)
问题是要描述太宽的含义。一种解决方案是建立数据点x坐标的日期差异的直方图(即概率密度函数),然后将这些差异视为太宽,例如前33%(或您希望的其他比例)。
例如,假设x坐标是年份:
1990 1995 2001 2002 2003 2010 2011 2012 2013 2017 2019
假设我们以年为单位计算日期差(我们可以选择其他任何持续时间单位)。我们计算上面两个值之间的差异,并在下面建立直方图。
Counts: 5 1 0 1 1 1 1
Diff.: 1 2 3 4 5 6 7
现在,如果我们选择将直方图的前33%差异保持在断开状态,则意味着大于或等于5年的差异将断开。