datastax mahout无法从datastax solr索引创建TFIDF向量

时间:2014-10-15 12:51:17

标签: solr lucene mahout datastax-enterprise datastax

我在datastax 4.5创建的solr索引上运行datastax 4.5 mahout。

dse mahout lucene.vector
--dir /var/lib/cassandra/data/solr.data/test.test/index/ 
--field body 
--dictOut $WORK_DIR/solr/wikipedia/dict.txt
--output $WORK_DIR/solr/wikipedia/out.txt 
--max 50

在mahout page中提及"您的Lucene索引必须使用Mahout中使用的相同版本的Lucene创建。 从Mahout 0.9开始,这是Lucene 4.6.1。 &#34 ;. datastax 4.5仅提供mahout 0.8。我在页面中说到了Exception。

我安装了Mahout 0.9并尝试使用相同的命令来读取datastax solr索引。我得到错误"线程中的异常" main" java.lang.IllegalArgumentException:类型为org.apache.lucene.codecs.Codec的SPI类,名称为' dse452'不存在。"似乎datastax修改了solr索引信息。

解决兼容问题的任何线索?

1 个答案:

答案 0 :(得分:0)