我正在使用ELKI GUI来运行DBSCAN算法。我的输入是CSV文件。我创建了一个投影作为特征选择:
-dbc.filter transform.ProjectionFilter -projection NumericalFeatureSelection -projectionfilter.selectedattributes 1,2
ELKI给了我一些文件作为集群。这些文件仅包含投影属性,而 UserId 等其他属性不存在。如何识别群集中每个对象的 UserId ?
答案 0 :(得分:2)
最简单的方法是使用投影删除不需要的列(删除这些列) ,而是将它们视为标签 。因为这就是它们,标签。
通常,最可靠的方法是在每个对象中包含唯一标识符(对象标签),如果您希望之后识别点。
换句话说,使用
-parser.labelIndices 0
而不是您的过滤器(当然,选择您的标签列 - 假设您的用户ID位于第0列)。