标签: sequence key-value mahout
我正在通过'Mahou in Action'学习Mahout,现在我在第8章。我刚刚下载了Reuters-21578文件并使用以下命令将所有文档转换为SequenceFile:
bin/mahout seqdirectory -c UTF-8 -i examples/reuters-extracted/ -o reuters-seqfiles
我在'reuters-seqfiles'文件夹中得到了块0。
我的问题是:如何知道哪个文件已分配到此序列文件中的哪个ID?