我一直在浏览this blog post,其中包含一个SimpleTagger示例。
它说:
给定一个输入文件" sample"如下:
CAPITAL Bill noun
slept non-noun
here non-noun
where all but the last token on each line is a binary feature, and the last token on the line is the label name
那么,如何在此处添加字级功能?
示例:单词中的音节数,单词的长度等
答案 0 :(得分:1)
最后一个令牌之前的所有内容都被视为一项功能。您应该可以在此之前添加任意功能:
CAP SYL1 CHAR4 Bill noun
SYL3 CHAR9 responded non-noun
...