如何检测复合词/多个单词作为一个术语。

时间:2014-11-07 21:09:43

标签: nlp

目前我正在尝试从文本中检测名词。 我想将单词/多字表达式复合为一个术语。 例如,我想将“股市”视为一个术语,而不是“股票”和“市场”。

如果您知道任何工具,相关文件等,请告诉我们。

2 个答案:

答案 0 :(得分:2)

您对搭配很感兴趣。 假设检验是一种很好的开始,而且从统计的角度来看,它会给你很好的见解。

请按照此处的食谱:http://nlp.stanford.edu/fsnlp/promo/colloc.pdf

还有基于规则的符号方法,您应该自己轻松找到。

祝你好运。

答案 1 :(得分:2)

许多复合词都可以使用伊利诺伊州的wikifier捕获。在这里看演示: http://cogcomp.cs.illinois.edu/demo/wikify/?id=25