我在datastax 4.5创建的solr索引上运行datastax 4.5 mahout。
dse mahout lucene.vector
--dir /var/lib/cassandra/data/solr.data/test.test/index/
--field body
--dictOut $WORK_DIR/solr/wikipedia/dict.txt
--output $WORK_DIR/solr/wikipedia/out.txt
--max 50
在mahout page中提及"您的Lucene索引必须使用Mahout中使用的相同版本的Lucene创建。 从Mahout 0.9开始,这是Lucene 4.6.1。 &#34 ;. datastax 4.5仅提供mahout 0.8。我在页面中说到了Exception。
我安装了Mahout 0.9并尝试使用相同的命令来读取datastax solr索引。我得到错误"线程中的异常" main" java.lang.IllegalArgumentException:类型为org.apache.lucene.codecs.Codec的SPI类,名称为' dse452'不存在。"似乎datastax修改了solr索引信息。
解决兼容问题的任何线索?
答案 0 :(得分:0)
在类路径中包含Lucene Codecs JAR:http://mvnrepository.com/artifact/org.apache.lucene/lucene-codecs