如何训练直线链CRF?

时间:2014-09-26 10:07:21

标签: algorithm text-mining pos-tagger crf

我想制作一个简单的线性链CRF。我正在寻找一些要求我从我的项目中提取一些功能的期刊。功能如:

  1. f1(s,i,li,li-1),= 1如果li = ADVERB且第i个字以“-ly”结尾;否则为0。
  2. f2(s,i,li,li-1),= 1如果i = 1,li = VERB,并且句子以问号结束; 0否则
  3. s =句子; i =单词的位置; li =当前单词的标签;和li-1 =前一个单词的标签。

    我的项目是POS标记到印尼语句子。 如何根据该特征计算权重?

1 个答案:

答案 0 :(得分:0)

如果您使用的是CRF ++,则可以在训练时使用-t文件获取分配给每个要素的要素权重。这将创建二进制和.txt模型文件。 .txt文件具有功能和相应的权重。

您可以查看this video,我已经显示了如何生成带有权重的文本文件。