我正在尝试优化solr。
solr> collection1附带的默认solrConfig包含了很多我不需要的库。也许如果有人可以帮助我们确定目的。 (我只从DIH导入):
请告诉我这些内容:
contrib/extraction/lib
solr-cell-
contrib/clustering/lib
solr-clustering-
contrib/langid/lib/
solr-langid
答案 0 :(得分:1)
的contrib /提取/ lib中
solr的细胞 - *
这些Solr Cell库与Tika集成,可帮助您索引Rich文档,例如Microsoft Word,Excel等。
的contrib /聚类/ lib中
solr的聚类 -
Solr clustering用于与Carrot集成的群集支持。 群集可以帮助您对文档,主题,实体提取等进行分组。
的contrib / LANGID / LIB /
的solr-LANGID
Solr Language I d用于语言检测。它增加了在编制索引之前检测文档语言的能力,然后对分析等做出适当的决定。
如果您没有使用上述任何功能,请排除jar,并确保从Solr配置文件中删除映射。