如何从一个句子中检测出谁,什么,何时,何处作为用户类型

时间:2014-12-08 13:37:15

标签: regex algorithm nlp tokenize

是否有一个好的算法/标记器/正则表达式或其他一些技术可以检测英语句子的哪个部分是用户输入的“who”,“what”,“when”和“where”? / p>

理想情况下,它可以在弹性搜索或javascript或.net中实现。

或许也许可以检测句子的主语和动词。

如果它适用于英语,它是否可以国际化?

1 个答案:

答案 0 :(得分:3)

我不知道是否有针对所有这四个问题的特定技术,但是已经开展了与每个问题相关的高级研究。

"谁","什么"和"其中"可以通过命名实体识别来解决。(http://nlp.stanford.edu/software/CRF-NER.shtml)。

"当"可能与时间标记领域更相关。(http://nlp.stanford.edu/software/sutime.shtml)。

检测主语,动词或任何其他词性的问题称为词性标注,其中存在大量的文库。

What is a good Java library for Parts-Of-Speech tagging?