我试图使用Solr创建语料库。我有一个名为" content"我需要索引和搜索bigrams和trigrams。还需要使用默认搜索进行索引和搜索。 如何配置这些东西?
答案 0 :(得分:3)
在执行标记化后,您必须将ShingleFilterFactory添加到字段定义中。您可以配置ShingleFilter以生成bigrams或trigrams。
没有“默认搜索”这样的东西,但捆绑的架构包含一个名为text_general的字段,可能是常规搜索的良好匹配。你将有两个不同的领域,一个用于搜索带状疱疹(你可能想要匹配整个二元组/三元组),另一个用于“常规搜索”。
您可以使用copyField
指令(例如<copyField source="content" dest="content_ngrams" />
)向两个字段添加相同的内容。您可以在查询时使用qf
来说明要查询的字段,或者是否要为匹配对字段进行不同的评分(即,在bi / trigram中增加匹配)。您还可以查询与fieldname:value
的直接匹配,具体取决于您查询索引的方式。