我正在使用Lingua::TreeTagger进行POS标记,但它的标记只是字符串的第一个字。
my $tagger = Lingua::TreeTagger->new(
'language' => 'english',
'options' => [ qw( -token -lemma -no-unknown ) ],
);
$text_to_tag = 'I another yet sample text I.';
my $tagged_text = $tagger->tag_text( \$text_to_tag );
print Dumper $tagged_text;
上述翻斗车的输出如下:
'sequence' => [
bless( {
'is_SGML_tag' => 0,
'original' => 'I',
'tag' => 'PP',
'lemma' => 'I'
}, 'Lingua::TreeTagger::Token' )
],
请注意,此处仅标记I
,但我想标记整个句子。在我的实际代码中,我想标记文件的内容。 如何标记句子的所有单词?感谢任何帮助。