使用RNN进行POS标记

时间:2016-04-29 12:38:01

标签: python nlp tensorflow theano deep-learning

我使用RNN实现了一个POS标记器。如果当前单词是W_i:

,则有3个功能
  • 特征1:W_i-2,W_i-1,W_i,W_i + 1,W_i + 2
  • 功能2:功能1,2的后缀
  • 特征3:[如果W_i全部为大写,如果W_i全部为小写,则为 W_i的第一个字符是大写字母]

在我的模型中,我有两个RNN,对于Feature 1和Feature 2,然后连接RNN和Feature 3的输出,然后是softmax。功能1的RNN是双向的。

我在PennTree Bank上尝试了我的模型,但准确度非常低(在培训和评估中都<50%)。只是想知道,如果有人知道在python中使用RNN(基于单词的特性)的开源POS标记器,我可以将它与我的模型进行比较,那么我可以找到我的代码中是否存在错误或仅仅是因为该模型不起作用。

谢谢,

1 个答案:

答案 0 :(得分:1)

有一个使用双向LSTM和CRF实现。可以找到here.