搜索引擎的Web应用程序 - 多语言和多基础

时间:2010-10-01 13:35:35

标签: mysql mongodb solr search-engine sphinx

我正在开发一个网站项目。我们有一个MySql和一个MongoDb基础。

  • 我们希望在这些基础上添加一个全文搜索引擎(如果它可以与PostgreSql链接,那就更好了。)

  • 这些数据库包含多语言文字但我们无法确定语言。

我看过Solr,ElasticSearch和Sphinx,但您对此主题的建议是什么?

  • Solr和Sphinx有干预,但我不确定在没有内容语言知识的情况下我们可以使用它...

  • 弹性是完整的JSON,如果我们使用越来越多的mongoDb可能会更好......

2 个答案:

答案 0 :(得分:0)

使用什么搜索引擎并不重要,源代码高度依赖于语言。恕我直言,你必须以某种方式检测语言,以便将文本提供给适当的词干分析器。

答案 1 :(得分:0)

Basis Technologies的一款名为Rosette语言平台的产品可以自动检测您可能会查看的语言。

如果这是一个关键的集成机制,Solr支持结果的JSON(和索引???)。我会将“JSON”支持放在记分卡的下方,并将重点放在搜索引擎X对于我的域的相关结果方面。