我在python中使用python-crfsuite包,由Naoaki Okazaki开发的CRFSUITE实现(http://www.chokkan.org/software/crfsuite/)
我想使用先前标记的实体类作为特征,这将帮助我识别多字命名实体。 我的训练数据示例:
[(拉希加信息技术,B-助洗剂),(远景,I-助洗剂),(是,O),(非常,O),(著名,O)]
这里,如果我可以在训练时使用以前的类功能。但是在预测时我们将功能列表传递给tagger对象。 测试时的问题是前一课不知道。
任何人都可以在python-crfsuite中告诉我这是否可行。 我觉得我们将功能传递给tagger对象的方式是不可能的。