我正在寻找一种方法来使用以属性为条件的功能并在mallet中标记bigrams。我仍然试图了解如何才能使用刚生成的令牌标签作为确定下一个令牌标签的功能?生成的标记的特征向量是否为前一个标记的标签?
我是否误解了CRF允许使用预测的先前标签作为下一个令牌的功能?
提前致谢!
答案 0 :(得分:2)
令牌的特征向量是否作为前一个令牌的标签生成?
不,CRF联合优化损失,没有从MEMM中预测标签然后使用它的从左到右的处理。 CRF会考虑所有可能的先前标签并找到最可能的序列。
我是否误解了CRF允许使用预测的先前标签作为下一个令牌的功能?
CRF允许使用以前的标签作为功能;很可能它已经在您的情况下自动发生。我没有Mallet的经验,但在大多数开箱即用的线性链CRF包中有两种功能:
有时您还可以在用户定义的功能上调节(2)转换功能,这些功能取决于当前令牌。看来这就是你要找的东西,但我不确定。一些包实现了这个(例如马鹿),有些不实现(例如crfsuite)。一些包允许定义任意CRF,并使用任意特征(例如pystruct,factorie,GRMM(?))。对不起,我没有使用Mallet的经验,所以这不是一个真正的答案:)