检索由其字段内容指定的N-gram的频率

时间:2014-05-23 12:20:24

标签: lucene field frequency n-gram

有没有办法检索与Lucene 4.7.2索引中特定字段内容匹配的N-gram频率?

我想找到并计算3克的所有出现,其中第一个标记是形容词(JJ),第二个标记是形容词(JJ),第三个标记是名词(NN)。该POS信息包含在名为postag的字段中。

我想到了一个使用IndexSearcher postag:"JJ JJ NN"的查询,但我不确定如何使用结果来计算出现次数。

任何帮助表示赞赏!

0 个答案:

没有答案