我想索引大量的pdf文档。
我找到了一个参考,显示它可以使用Apache Tika完成,但遗憾的是我找不到任何描述我可以在Solr 1.4.1中配置Apache Tika的参考。
配置完成后我确实配置了它,如何直接将文件发送到Solr而不使用curl?
我正在使用solrnet进行索引。
答案 0 :(得分:5)
答案 1 :(得分:3)
对ExtractingRequestHandler in SolrNet的支持尚未完成。您可以完成它的实现,也可以解决它并制作自己的HttpWebRequests。