我正在评估搜索技术,而且我的要求之一是还必须能够找到翻译过的文本。
例如,有一些用英文和法文写的文本文件。 lucene将对它们进行索引。
如果我要搜索字符串“ apple”,则应同时搜索“ apple”和“ pomme”,并同时显示其中的文档。
有什么技术可以提供标记词的自动翻译?
或者唯一的方法就是使用Google API进行翻译,然后将其提供给lucene进行索引?
答案 0 :(得分:0)
Lucene / Solr / Elasticsearch中没有自动翻译,但是它们具有类似的功能,称为同义词。您可以使用Google Api创建同义词列表,以翻译搜索时间而不是索引时间中的术语。
使用这种方法,您可以搜索“ apple”,搜索引擎将看到“ apple”和“ pomme”作为同义词,并且您将获得预期的结果。