Question

我想在pylucene中编写自定义分析器。通常在java lucene中，当你编写一个分析器类时，你的类继承了lucene的Analyzer类。

但是pylucene使用jcc，java到c ++ / python编译器。

那么如何让python类使用jcc从java类继承，特别是如何编写自定义pylucene分析器？

感谢。

Answer 1

以下是包装EdgeNGram过滤器的分析器示例。

import lucene
class EdgeNGramAnalyzer(lucene.PythonAnalyzer):
    '''
    This is an example of a custom Analyzer (in this case an edge-n-gram analyzer)
    EdgeNGram Analyzers are good for type-ahead
    '''

    def __init__(self, side, minlength, maxlength):
        '''
        Args:
            side[enum] Can be one of lucene.EdgeNGramTokenFilter.Side.FRONT or lucene.EdgeNGramTokenFilter.Side.BACK
            minlength[int]
            maxlength[int]
        '''
        lucene.PythonAnalyzer.__init__(self)
        self.side = side
        self.minlength = minlength
        self.maxlength = maxlength

    def tokenStream(self, fieldName, reader):
        result = lucene.LowerCaseTokenizer(Version.LUCENE_CURRENT, reader)
        result = lucene.StandardFilter(result)
        result = lucene.StopFilter(True, result, StopAnalyzer.ENGLISH_STOP_WORDS_SET)
        result = lucene.ASCIIFoldingFilter(result)
        result = lucene.EdgeNGramTokenFilter(result, self.side, self.minlength, self.maxlength)
        return result

Answer 2

你可以从pylucene中的任何类继承，但名称以 Python 开头的那些也将extend the underlying Java class，即，当从java代码调用时，使相关方法“虚拟” 。因此，对于自定义分析器，继承自 PythonAnalyzer 并实现 tokenStream 方法。

使用jcc在pylucene / inheritance中编写自定义分析器？

2 个答案: