当我尝试将lucene索引转换为vector时,我使用命令行
/bin/mahout lucene.vector
转换为序列文件。是否有用于此类任务的Java API?
答案 0 :(得分:0)
我想我发现solution可能会帮助我(和你)到达那里。在Driver.java中,有一个main()
方法,显示它们是如何做到的。您需要设置所有配置,然后调用应转储到目录的luceneDriver.dumpVectors()
。
答案 1 :(得分:0)
可能会迟到但答案可以在这里找到:
https://blog.trifork.com/tag/apache-hadoop/
“驯服文本”一书中的第六章也会有所帮助,我想你可以在网上找到它作为一个例子。
希望有人发现它有用。