标签: java hadoop hdfs mahout
我在hdfs中使用逗号分隔数据,我想将其转换为与Mahouts Kmeans一起使用的向量。 mahout seqdirectory和seq2sparse中有标志将目录中的数据转换为向量。给出的示例是文本文件。是否有csv的等效标志或是否有关于如何创建此类文件的教程?
seqdirectory
seq2sparse