时间密度事件

时间:2015-01-06 10:56:04

标签: events math time data-representation

我正在进行一项任务,我应该计算事件的密度。假设某个事件在几秒钟内发生了5次,这意味着它的密度将高于在几小时内发生5次的密度。

我拥有,事件发生的时间。

我首先考虑计算每两个连续事件之间的经过时间,然后使用这些值的平均值和平均值进行计算。

我的问题是我不知道如何通过数学准确地表达这种密度概念。假设我有5个事件发生在彼此非常接近,然后是长时间休息,然后又发生了5个事件,彼此非常接近。我希望能够将其表示为高密度。我应该怎么做呢?

在最后一个例子中,我明白我的意思不会真正具有代表性,但我的标准偏差会表明这一点。但是,我怎么能有一个密度值(假设在0和1之间),我可以用它来排列不同的事件?

感谢您的帮助!

2 个答案:

答案 0 :(得分:1)

我会尝试harmonic mean,它代表你的事件发生的速度,仍然给你一个平均时间值。它的定义是:

harmonic mean definition

我认为它的行为接近你所期望的,因为它测量你想要的东西,但不是在0和1之间,并且具有反向趋势(小值意味着密集,大值意味着稀疏)。我们来看几个例子:

    一小时内
  1. ~5个事件。让我们假设为简单起见,每个事件之间有10分钟。然后我们有H = 6 /(6 * 1/10) = 10
  2. ~10分钟内的5个事件,然后直到小时结束(50分钟)。我们假设所有短间隔都是2.5分钟,然后是H = 6 / (5/2.5 + 1/50) = 6 * 50 / 101 = 2.97
  3. 在10分钟内
  4. ~5个事件,但是这个循环每半小时重新开始一次,因此我们有20分钟作为最后一个间隔而不是50.然后我们得到H = 6 / (5/2.5 + 1/20) = 6 * 20 / 41 = 2.92
  5. 正如你所看到的那样,由于我们使用了逆,因此减少了一组中较长和较稀有的值的影响,从而减少了在爆发之间的重量"行为。您还可以将行为与相同的"突发密度进行比较"但这不会以相同的频率发生,你会得到接近的数字,但其排序仍然反映了这种差异。

答案 1 :(得分:0)

要使密度有意义,你需要定义两件事:

  • 你看它的范围,
  • 和时间单位

之后你可以说,例如,从12:00到12:10,事件的密度平均为10 /分钟。

在您的情况下,有意义的显然取决于您的输入数据。如果您的测量持续1小时并且您有数百万个条目,则可能是秒或毫秒是单位的更好选择。如果您测量一周并且有一些条目,则日期是更好的单位。