减少离散偏斜数据中的偏斜

时间:2019-11-16 09:13:28

标签: r transformation distribution standardized

我有数据carData::GSSvocab,如果可以减少变量educvocab的偏度,我应该尝试。

> skewness(GSSvocab$educ, na.rm = TRUE)
[1] -0.3542359
> skewness(GSSvocab$vocab, na.rm = TRUE)
[1] -0.2322783

我尝试过转换,但是根本没有取得好的结果。

GSSvocab <- 
  GSSvocab %>% 
  mutate(educ.symmetric = sqrt(educ),
         vocab.symmetric = log(max(vocab, na.rm = TRUE) + 1 - vocab))

如果我看一下变换后的直方图,分布的确确实看起来更加对称,但是偏度的值变得更加极端。

> skewness(GSSvocab$educ.symmetric, na.rm = TRUE)
[1] -1.62018
> skewness(GSSvocab$vocab.symmetric, na.rm = TRUE)
[1] -1.153344

我的问题是:是否可以实现对称分布?我不这么认为,因为数据是离散的,没有太多不同的值。但是我不想不对此进行交叉核对就得出这个结论。

0 个答案:

没有答案