归一化数据以进行趋势分析

时间:2019-06-14 05:34:01

标签: normalization data-analysis standardized

我正在尝试分析和规范以下内容。 每行都有一台计算机,其中包含一天中崩溃的时间。该行还具有版本号。

计算机版本会随着时间更新。

目标是查看崩溃次数随时间变化的趋势,以及更新次数是否导致了更多或更少的崩溃。

这就是数据的样子。

date    computer    version times_crashed   
d1      c1          v1      2   
d2      c1          v1      5   
d1      c2          v1      1   
d3      c3          v2      0   
d3      c4          v2      3   
d3      c5          v2      2   
d4      c5          v2      1   
d5      c5          v2      1   
d6      c4          v2      1   
d6      c1          v2      2   


version computer_count  disticnt_computer_count crash_count crash_per_computer
v1      3               2                       6           3
v2      7               4                       10          2.5

我想获取每台计算机的崩溃次数。

如何在考虑计算机总数的情况下标准化数据? 这是正确的计算方法吗?

我应该使用整体计算机,其他计算机还是存在标准化问题的计算机?

0 个答案:

没有答案