Lingua :: TreeTagger仅标记词性标注中的第一个单词

时间:2016-01-13 09:33:55

标签: perl nlp pos-tagger

我正在使用Lingua::TreeTagger进行POS标记,但它的标记只是字符串的第一个字。

my $tagger = Lingua::TreeTagger->new(
    'language' => 'english',
    'options'  => [ qw( -token -lemma -no-unknown ) ],
);
$text_to_tag = 'I another yet sample text I.';
my $tagged_text = $tagger->tag_text( \$text_to_tag );
print Dumper $tagged_text;

上述翻斗车的输出如下:

'sequence' => [
                                 bless( {
                                          'is_SGML_tag' => 0,
                                          'original' => 'I',
                                          'tag' => 'PP',
                                          'lemma' => 'I'
                                        }, 'Lingua::TreeTagger::Token' )
                               ],

请注意,此处仅标记I,但我想标记整个句子。在我的实际代码中,我想标记文件的内容。 如何标记句子的所有单词?感谢任何帮助。

0 个答案:

没有答案