从Tagger获取其他信息(主动/被动,时态......)

时间:2013-10-21 13:31:58

标签: nlp stanford-nlp pos-tagger

我正在使用Stanford Tagger来确定词性。但是,我希望从文本中获取更多信息。是否有可能获得更多信息,如句子时态或是否处于主动/被动状态?

到目前为止,我正在使用非常基本的PoS-Tagging方法:

List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>();

String input = "This sentence is going to be future. The door was opened.";
for (List<HasWord> sentence : MaxentTagger.tokenizeText(new StringReader(input)))
{
     taggedUnits.add(tagger.tagSentence(sentence));
}

1 个答案:

答案 0 :(得分:15)

您可以从各种penn标签获取紧张信息:

27. VB  Verb, base form
28. VBD Verb, past tense
29. VBG Verb, gerund or present participle
30. VBN Verb, past participle
31. VBP Verb, non-3rd person singular present
32. VBZ Verb, 3rd person singular present

关于主动/被动方面,您可以使用Stanford Core NLP中包含的类型依赖项。

  1. 如果句子处于主动语态,则表示“&lt; nsubj&#39;应该存在依赖性。
  2. 如果句子是被动语态,则可以使用&nbsp;}&#39; nsubjpass&#39;依赖应该 存在
  3. 希望这有帮助。