将csv格式的hdfs文件转换为Mahout矢量文件

时间:2014-02-12 23:05:13

标签: java hadoop hdfs mahout

我在hdfs中使用逗号分隔数据,我想将其转换为与Mahouts Kmeans一起使用的向量。 mahout seqdirectoryseq2sparse中有标志将目录中的数据转换为向量。给出的示例是文本文件。是否有csv的等效标志或是否有关于如何创建此类文件的教程?

0 个答案:

没有答案