让solr了解英语

时间:2014-06-19 09:44:10

标签: solr lucene uima

我正在尝试设置理解英语的solr。例如,我已将我们公司的网站(www.biginfolabs.com)编入索引,或者它可以是任何其他网站或我们自己的数据。

如果我提出一些类似英语的查询,我应该得到一个单词的答案,就像Google所做的那样;查询是:

  • 印度所在地。
  • 谁是奥巴马的父亲。

解决方法:

  • 集成UIMA,Mahout与solr(人名,城市名称提取完成)。
  • 我读了一本名为“驯服文字”的书并实施了https://github.com/tamingtext/book。但是没得到我想要的东西。

任何人都可以告诉我们如何进一步行动。它可以是我们团队准备做的任何事情。

1 个答案:

答案 0 :(得分:0)

此任务称为命名实体识别。您可以查看this tutorial以查看他们如何将Solr用于文本中的提取原子元素到预定义的类别,例如人员,组织,位置,时间表达式,数量,货币值,百分比等的名称,然后学习模型来回答问题。

另请参阅Stanford NLP,了解有关可以使用的算法的更多建议。