变异系数?

时间:2017-05-09 14:29:43

标签: statistics histogram std variance

我有一个以指数方式递增的值列表。我被要求有多个Coefficent变异。你可能会同意我的看法,CV仅适用于整组数字,并将数字组划分为子组,计算每个子组的CV似乎是不合理的。在多个CV背后是否会有任何统计学思想,如果存在,CV可以如何制作直方图,我的意思是历史记录的分类是什么。我提前感谢答案

1 个答案:

答案 0 :(得分:0)

我同意你的看法 - 为一个数据集计算多个CV是没有意义的,除非有一些推理理由这样做。

话虽如此,实际上可能有理由考虑数据集的子组。在统计学领域,语境就是一切。我的第一个想法是问你的同事为什么他们希望你这样做。也许有一个很好的理由,也许他们没有像你那样完全掌握统计数据,无论如何,它应该是一个有启发性的对话。

如果你决定走这条路,这里有一些可能有用的R代码(R很棒 - 灵活,强大,免费)

# first, simulating some fake data (100 values of measurement & group for 10 groups)
x <- rnorm(100, mean=10, sd=1)
group <- sample(LETTERS[1:10], 100, replace=T)

# first few values of each
head(data.frame(x, group))
          x group
1 10.778480     F
2  9.274193     B
3  9.639143     G
4  9.080369     I
5 10.727895     D
6 10.850306     G

# this is the part you'd actually need...
# calculating the sd & avgs for each group
sds <- tapply(x, group, sd)
avgs <- tapply(x, group, mean)

# then the cv
cvs <- sds/avgs

cvs
         A          B          C          D          E          F          G          H          I          J 
0.07859528 0.07570556 0.09370247 0.12552468 0.08897856 0.11044543 0.10947615 0.10323379 0.08908262 0.09729945 

# and if you want a histogram, R makes it pretty easy
hist(cvs)