标签: lucene field frequency n-gram
有没有办法检索与Lucene 4.7.2索引中特定字段内容匹配的N-gram频率?
我想找到并计算3克的所有出现,其中第一个标记是形容词(JJ),第二个标记是形容词(JJ),第三个标记是名词(NN)。该POS信息包含在名为postag的字段中。
我想到了一个使用IndexSearcher postag:"JJ JJ NN"的查询,但我不确定如何使用结果来计算出现次数。
postag:"JJ JJ NN"
任何帮助表示赞赏!