我正在尝试在流式视频网站上进行一些数据分析。为了帮助确定问题是在我身边还是用户身上,我已经开始收集流的带宽的均值和标准差。我不确定的是如何确定普通流应该是什么样子。
要弄清楚普通流应该是什么样子,我正在考虑找到以下内容:
这些统计数据有意义吗?
基本上,我试图通过寻找低带宽或高度可变带宽之类的东西来检测坏流。所以,我想我可以找到一些基线,然后寻找异常值。
此外,保留每个样本的所有数据是不可行的,因此我只能使用聚合统计信息。如果你还有什么建议我记录下来也会有很大的帮助。
答案 0 :(得分:0)
如果观察的数量足够大(比如> 30),只需建立一个置信区间(这里我用alpha = 0.05)
CI = [sample_mean-(sample_st.dev * 1.96)/ sqrt(观察数量); sample_mean +(sample_st.dev * 1.96)/ sqrt(观察数量)]
这是您确信95%样本的平均值落入的范围。要扩大置信区间,请在统计表上查找z(alpha / 2)并将其值替换为1.96(这是对于alpha = 0.05)。
P.S。 以下参数对我来说没什么意义.. StdDevs的平均值 - 正常变化量是多少 StdDevs的StdDev - 平均StdDev变化多少