xml描述符中的trigram和prevtwomap特征生成器

时间:2017-03-09 13:49:20

标签: opennlp named-entity-recognition

我正在使用OpenNLP NameFinder。它允许我们为这样的实体定义特征生成器(取自here):

 <generators>
  <cache> 
    <generators>
      <window prevLength = "2" nextLength = "2">          
        <tokenclass/>
      </window>
      <window prevLength = "2" nextLength = "2">                
        <token/>
      </window>
      <definition/>
      <prevmap/>
      <bigram/>
      <sentence begin="true" end="false"/>
    </generators>
  </cache> 
</generators>

但我无法为TrigramFeatureGenerator和PrevTwoMapFeatureGenerator找到XML特征生成器。我试过,但它显示InvalidFormatException。谁能告诉我Trigram和PrevTwoMap特征生成器的xml描述符?

1 个答案:

答案 0 :(得分:0)

我没有找到 TrigramNameFeatureGenertor PreviousTwoMapFeatureGenerator 的任何标准xml描述符,但我想出了办法。我将 trigram prevtwomap 注册为自定义xml描述符,指向各自的java类。