我正在尝试使用DMwR
包在R中实现LOF算法。我使用的数据集是来自UCI机器学习库的Wisconsin Breast Cancer dataset(对于我已经将2转换为'良性'以及4到'恶性'的最后一列)它看起来我在csv文件中输入的内容是这样的:
"Clump Thickness","Uniformity of Cell Size", "Uniformity of Cell Shape","Marginal Adhesion" ,"Single Epithelial Cell Size","Bare Nuclei" , "Bland Chromatin" ,"Normal Nucleoli" ,"Mitoses" , "Class"
5,1,1,1,2,1,3,1,1,benign
5,4,4,5,7,10,3,2,1,benign
3,1,1,1,2,2,3,1,1,benign
然后我使用这些命令集
breastcancer <- read.csv("breastcancer.csv", sep = ",")
breastcancer2 <- breastcancer[,1:9]
outlierscores <- lofactor(breastcancer2, k=5)
然而,它给了我错误:
Error in scale.default(temp, x, FALSE) :
length of 'center' must equal the number of columns of 'x'
有人可以帮我确定问题吗?
答案 0 :(得分:0)
lofactor()无法计算因子类型数据,请确保您的数据类型为数字