我有数据carData::GSSvocab
,如果可以减少变量educ
和vocab
的偏度,我应该尝试。
> skewness(GSSvocab$educ, na.rm = TRUE)
[1] -0.3542359
> skewness(GSSvocab$vocab, na.rm = TRUE)
[1] -0.2322783
我尝试过转换,但是根本没有取得好的结果。
GSSvocab <-
GSSvocab %>%
mutate(educ.symmetric = sqrt(educ),
vocab.symmetric = log(max(vocab, na.rm = TRUE) + 1 - vocab))
如果我看一下变换后的直方图,分布的确确实看起来更加对称,但是偏度的值变得更加极端。
> skewness(GSSvocab$educ.symmetric, na.rm = TRUE)
[1] -1.62018
> skewness(GSSvocab$vocab.symmetric, na.rm = TRUE)
[1] -1.153344
我的问题是:是否可以实现对称分布?我不这么认为,因为数据是离散的,没有太多不同的值。但是我不想不对此进行交叉核对就得出这个结论。