我正在尝试分析和规范以下内容。 每行都有一台计算机,其中包含一天中崩溃的时间。该行还具有版本号。
计算机版本会随着时间更新。
目标是查看崩溃次数随时间变化的趋势,以及更新次数是否导致了更多或更少的崩溃。
这就是数据的样子。
date computer version times_crashed
d1 c1 v1 2
d2 c1 v1 5
d1 c2 v1 1
d3 c3 v2 0
d3 c4 v2 3
d3 c5 v2 2
d4 c5 v2 1
d5 c5 v2 1
d6 c4 v2 1
d6 c1 v2 2
version computer_count disticnt_computer_count crash_count crash_per_computer
v1 3 2 6 3
v2 7 4 10 2.5
我想获取每台计算机的崩溃次数。
如何在考虑计算机总数的情况下标准化数据? 这是正确的计算方法吗?
我应该使用整体计算机,其他计算机还是存在标准化问题的计算机?