如何知道哪个文本文档映射到哪个ID

时间:2012-02-22 05:13:18

标签: sequence key-value mahout

我正在通过'Mahou in Action'学习Mahout,现在我在第8章。我刚刚下载了Reuters-21578文件并使用以下命令将所有文档转换为SequenceFile:

bin/mahout seqdirectory -c UTF-8
-i examples/reuters-extracted/ -o reuters-seqfiles

我在'reuters-seqfiles'文件夹中得到了块0。

我的问题是:如何知道哪个文件已分配到此序列文件中的哪个ID?

0 个答案:

没有答案