如何在Stanford POS-Tagger的训练模型中添加更多标记的单词?

时间:2011-04-06 17:50:16

标签: pos-tagger

我没有在文档中找到有关向标记器添加更多标记字词的内容,特别是双向字词。 感谢

2 个答案:

答案 0 :(得分:1)

目前,你不能。模型培训是一次性操作。 (由于标记器使用考虑了上下文和频率的权重,因此在事后添加新单词并非易事。)

答案 1 :(得分:0)

有一种解决方法。这很难看,但应该做到这一点:

  • 建立一个“你的”字样列表
  • 扫描这些单词的文字
  • 如果发现任何匹配自己的POS标记(NLTK可以帮到你)
  • 将它提供给斯坦福解析器。

FROM:http://www.cs.ucf.edu/courses/cap5636/fall2011/nltk.pdf “你也可以给它贴上POS标签;解析器会尝试使用 你的标签是否有意义。 如果解析器进行标记,您可能希望这样做 文本域中的错误。“