应用错误收集

我有数据carData::GSSvocab，如果可以减少变量educ和vocab的偏度，我应该尝试。

> skewness(GSSvocab$educ, na.rm = TRUE)
[1] -0.3542359
> skewness(GSSvocab$vocab, na.rm = TRUE)
[1] -0.2322783

我尝试过转换，但是根本没有取得好的结果。

GSSvocab <- 
  GSSvocab %>% 
  mutate(educ.symmetric = sqrt(educ),
         vocab.symmetric = log(max(vocab, na.rm = TRUE) + 1 - vocab))

如果我看一下变换后的直方图，分布的确确实看起来更加对称，但是偏度的值变得更加极端。

> skewness(GSSvocab$educ.symmetric, na.rm = TRUE)
[1] -1.62018
> skewness(GSSvocab$vocab.symmetric, na.rm = TRUE)
[1] -1.153344

我的问题是：是否可以实现对称分布？我不这么认为，因为数据是离散的，没有太多不同的值。但是我不想不对此进行交叉核对就得出这个结论。