归一化总和(情况......)

时间:2016-02-10 10:47:58

标签: r prediction netezza training-data normalize

在Netezza中,我运行了以下查询,将名义变量变为二项变量,并将它们相加:

sum(case when c.COUNTRYCODE = 'US' then 1 else 0 end) as US

我为多个国家和其他类似(分类)变量执行此操作。

然后,我用R来规范化数据:

normalize <- function(x) { return( (x - min(x)) / (max(x) - min(x)) ) }

我将它们放在R:

的数据框中
all_n <- as.data.frame(lapply(all[,c(1:56)], normalize))

制作火车并测试数据。 接下来我运行这行代码:

m1<-knn(train=alltrain,test=alltest,cl=alltrain_target,k=53)

所有似乎都有效,并且对k近邻的预测似乎也做得很好,因为它预测它是正确的。我用

检查一下
table(alltest_target,m1) 

在R.

然而,这个方法是否正常,因为我规范化和(案例..)?或者我应该以不同的方式解决这个问题?那么规范化和(案例..)是否正确?

0 个答案:

没有答案