使用ELKI,遇到尺寸高于14

时间:2015-05-28 10:57:53

标签: cluster-analysis dimensions elki

我正在尝试在ELKI中使用SUBCLU,但是为了解决问题,我尝试了DBSCAN,甚至是KMEANSLloyd,所以我知道如何输入高维数据。不幸的是,我只能输入最多14个维度,任何更高的程序开始抱怨我没有输入“bubble.scaling”参数,即使我非常清楚。我正在使用.csv文件输入数据,该文件的格式与“mouse.csv”教程文件类似(这就是我如何在第一时间输入尺寸大于1的数据)。我做错了什么?

2 个答案:

答案 0 :(得分:1)

原来我没有正确格式化CSV文件。而不是让CSV文件只包含其中的数据,以便用维度空间分隔,我还需要包含标题。由于我没有使用随机生成的信息,而且我事先并不知道群集的数量,这就是CSV的样子。

## Size: 10
########################################################
1 2 3 4 5 6 7 8 9 10 11 12 13 14
1 2 3 4 5 6 7 8 9 10 11 12 13 14
14 13 12 11 10 9 8 7 6 5 4 3 2 1
14 13 12 11 10 9 8 7 6 5 4 3 2 1

答案 1 :(得分:0)

我遇到了同样的问题。在我的情况下,事实证明我的csv文件只包含整数列,它们被视为字符串而不是数字。通过将dbc.parser设置为CategoricalDataAsNumberVectorParser,outofbounds错误消失了。通过使列真正数字化,我得到了我想要的结果。