如何使用mahout java api将lucene索引转换为vector?

时间:2013-07-26 03:10:24

标签: lucene indexing mahout

当我尝试将lucene索引转换为vector时,我使用命令行 /bin/mahout lucene.vector转换为序列文件。是否有用于此类任务的Java API?

2 个答案:

答案 0 :(得分:0)

我想我发现solution可能会帮助我(和你)到达那里。在Driver.java中,有一个main()方法,显示它们是如何做到的。您需要设置所有配置,然后调用应转储到目录的luceneDriver.dumpVectors()

答案 1 :(得分:0)

可能会迟到但答案可以在这里找到:
https://blog.trifork.com/tag/apache-hadoop/ “驯服文本”一书中的第六章也会有所帮助,我想你可以在网上找到它作为一个例子。

希望有人发现它有用。