目前我正在尝试从文本中检测名词。 我想将单词/多字表达式复合为一个术语。 例如,我想将“股市”视为一个术语,而不是“股票”和“市场”。
如果您知道任何工具,相关文件等,请告诉我们。
答案 0 :(得分:2)
您对搭配很感兴趣。 假设检验是一种很好的开始,而且从统计的角度来看,它会给你很好的见解。
请按照此处的食谱:http://nlp.stanford.edu/fsnlp/promo/colloc.pdf
还有基于规则的符号方法,您应该自己轻松找到。
祝你好运。答案 1 :(得分:2)
许多复合词都可以使用伊利诺伊州的wikifier捕获。在这里看演示: http://cogcomp.cs.illinois.edu/demo/wikify/?id=25