我有一个以指数方式递增的值列表。我被要求有多个Coefficent变异。你可能会同意我的看法,CV仅适用于整组数字,并将数字组划分为子组,计算每个子组的CV似乎是不合理的。在多个CV背后是否会有任何统计学思想,如果存在,CV可以如何制作直方图,我的意思是历史记录的分类是什么。我提前感谢答案
答案 0 :(得分:0)
我同意你的看法 - 为一个数据集计算多个CV是没有意义的,除非有一些推理理由这样做。
话虽如此,实际上可能有理由考虑数据集的子组。在统计学领域,语境就是一切。我的第一个想法是问你的同事为什么他们希望你这样做。也许有一个很好的理由,也许他们没有像你那样完全掌握统计数据,无论如何,它应该是一个有启发性的对话。
如果你决定走这条路,这里有一些可能有用的R代码(R很棒 - 灵活,强大,免费)
# first, simulating some fake data (100 values of measurement & group for 10 groups)
x <- rnorm(100, mean=10, sd=1)
group <- sample(LETTERS[1:10], 100, replace=T)
# first few values of each
head(data.frame(x, group))
x group
1 10.778480 F
2 9.274193 B
3 9.639143 G
4 9.080369 I
5 10.727895 D
6 10.850306 G
# this is the part you'd actually need...
# calculating the sd & avgs for each group
sds <- tapply(x, group, sd)
avgs <- tapply(x, group, mean)
# then the cv
cvs <- sds/avgs
cvs
A B C D E F G H I J
0.07859528 0.07570556 0.09370247 0.12552468 0.08897856 0.11044543 0.10947615 0.10323379 0.08908262 0.09729945
# and if you want a histogram, R makes it pretty easy
hist(cvs)