我的数据包含14列预测变量和1列解决方案变量(y)。
我想知道是否有任何内置函数来规范化和反规范化R中的数据。
谢谢。
答案 0 :(得分:0)
可以使用{Rmisc}包的normDataWithin:http://www.inside-r.org/packages/cran/Rmisc/docs/normDataWithin
可以使用以下方法:
(变量均值)/ sd。以下代码可用于data.frame:
mydata$myNormalizedVar<-(mydata$myvar-mean(mydata$myvar))/sd(myvar)
log(log10),log2和square root(sqrt)
正常分位数归一化或正常分位数变换。试试:
quantNorm = function(x){qnorm(rank(x,ties.method = "average")/(length(x)+1))}
hist(quantNorm(1:10000),100)