在scale.default中获取错误(temp,x,FALSE):' center'的长度必须等于' x'的列数。

时间:2015-05-08 08:41:22

标签: r data-mining outliers

我正在尝试使用DMwR包在R中实现LOF算法。我使用的数据集是来自UCI机器学习库的Wisconsin Breast Cancer dataset(对于我已经将2转换为'良性'以及4到'恶性'的最后一列)它看起来我在csv文件中输入的内容是这样的:

"Clump Thickness","Uniformity of Cell Size", "Uniformity of Cell Shape","Marginal Adhesion" ,"Single Epithelial Cell Size","Bare Nuclei" , "Bland Chromatin" ,"Normal Nucleoli" ,"Mitoses" , "Class"  
5,1,1,1,2,1,3,1,1,benign
5,4,4,5,7,10,3,2,1,benign
3,1,1,1,2,2,3,1,1,benign

然后我使用这些命令集

breastcancer <- read.csv("breastcancer.csv", sep = ",")
breastcancer2 <- breastcancer[,1:9]
outlierscores <- lofactor(breastcancer2, k=5)

然而,它给了我错误:

Error in scale.default(temp, x, FALSE) : 
  length of 'center' must equal the number of columns of 'x'

有人可以帮我确定问题吗?

1 个答案:

答案 0 :(得分:0)

lofactor()无法计算因子类型数据,请确保您的数据类型为数字