Question

我正在UCI存储库中提供的iris数据集中使用R工具执行Kmeans聚类。

以下是样本数据集：

SepalLength,SepalWidth,PetalLength,PetalWidth,Species
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa

我执行了以下三个命令：

iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv")
View(iris)
km<- kmeans(iris, 3)

我收到如下错误：

Error in kmeans(iris, 3) :
   more cluster centers than distinct data points.
In addition: Warning message:
In kmeans(iris, 3) : NAs introduced by coercion

我认为可能是因为第5列Species因为它是非数字的。因此，我从数据集中删除了该列，然后再次重复上述命令。但是，我仍然遇到同样的错误。

Answer 1

尝试使用此

＆＃13;

iris<-read.csv("C:/Users/admin/Desktop/Experiment/t2.csv", header=FALSE)

＆＃13;

在R中进行聚类时出错

1 个答案: