我试图在Java中找到collocations (PDF)。
我知道NLTK有一个搭配模块,但不想使用Jython。
我查看了OpenNLP和GATE,但他们似乎没有搭配查找器。
是否有人知道实施的免费开源搭配查找器 在Java?
答案 0 :(得分:2)
答案 1 :(得分:2)
对我来说,最好的准备好的搭配算法是Dragon Toolkit xTract,它使用基本的统计搭配功能,如lingpipe和更复杂的东西,如POS标记
答案 2 :(得分:1)
通过Grant Ingersoll's overview of new features in Mahout我发现Apache Mahout现在有一个collocations feature。这是Java中的开源,但需要Hadoop基础结构。