在solr中包含同义词

时间:2011-06-28 07:26:51

标签: solr synonym

我正在使用solr进行搜索。在这里我找到了一个synonyms.text文件,你可以在其中手动包含你想要的单词的同义词。

但是我认为由于我的应用程序有大量数据,因此每个单词手动包含同义词非常困难。

我想知道这个synonym.text文件是否有任何方式自动生成引用所有词典单词

1 个答案:

答案 0 :(得分:0)

多数民众赞成不可能。你需要至少两个单词之间的语义关系,即令牌。如果你有类似数据库的东西,包括语义同义词关系,你当然可以生成这些数据。

一个示例源是wiktonary(XML Dump:Link)。但也许还有其他可用的示例词典,但我认为你不会得到如此详尽的源代码。解析Wiktonary的XML转储可能是您的最佳选择,如果碰巧有多语言索引,您甚至可以将不同语言的同义词对齐。