使用stanford nlp查找句子的时态

时间:2014-03-03 06:12:04

标签: nlp stanford-nlp linguistics

Q1.I我试图让一个完整的句子变得紧张,只是不知道如何使用nlp来完成它。 任何帮助表示赞赏。

Q2。使用nlp可以从句子中提取所有信息吗?

目前我可以, 我得到:1。判决的声音         2.subject对象动词         3.POS标签。

可以提取更多信息,请告知我们。

3 个答案:

答案 0 :(得分:16)

Penn树库分别将VBDVBN定义为动词的过去时和过去分词。在许多句子中,只需获取POS标签并检查这两个标签的存在就足够了。然而,在其他情况下,可能存在多个时态的动词,而整个句子是过去时态。对于这些情况,您需要使用选区解析。斯坦福NLP还提供了解析器。您可以使用它来检测最外面的动词短语(标记为VP)。如果动词的过去时/分词形式是动词短语中所有其他动词的祖先,则应将句子的时态标记为过去时。

Dror给出的例子产生了这个:

(ROOT
  (S
    (NP (PRP I))
    (VP (VBD did) (RB n't)
      (VP (VB want)
        (NP (DT the) (NN dog)
          (S
            (VP (TO to)
              (VP (VB eat)
                (NP (PRP$ my) (NN homework))))))))
    (. .)))

即使 eat 未过去时,动词短语中最顶端的动词也会被正确标记VBD(即过去时)。

编辑(一些其他信息):

复杂句子具有所谓的主要时态次要时态。对于像“当我到达那里,他已经离开”这样的句子,没有“完全时态”这样的东西。您只能区分主要和次要。

如果您需要有关完美连续等的信息,那么您必须根据POS标记派生规则。例如。现在时的辅助动词后跟过去时的动词将表达现在的完成时(如果有明显的反例,请加上答案......我现在想不到任何一个)。

答案 1 :(得分:3)

基本上,英语句子的时态由句子头部的动词形式决定。您可以在此帖子中了解有关The Contextors’ Tense Conjugator的更多相关信息。使用解析器可以识别头部动词及其形式。

可以从句子中提取的信息类型取决于您执行的分析。您可以提取句子的其他组成部分,如介词补语,预测补语和辅助,以及其他语法属性,如方面,次要时,模态和极性。有些句子包含嵌入式子句,如下面Contextors API中的示例所示。在这种情况下,您可能还想从嵌入式子句中提取此信息。

enter image description here

答案 2 :(得分:2)

  

我想要完整时态,例如:简单呈现或呈现完美连续   紧张......据我所知,我不能简单地从POS标签中获取

请注意,上面示例中的内容不是时态的示例,而是某些时态/方面配置的示例。虽然时态紧张(过去,现在,将来)会产生时间上的可能性,但是方面类别(渐进的,连续的,完整的等等)却将可能性与时间流程联系起来(即它是否有界/完成,是否是一个连续的事件,等等。因此,时态和方面是两个不同的语法范畴。在英语中,它们都是语言复合体的一部分,这使得它们很容易混淆,并且可以用一种方法查找/分析它们。在许多其他语言中,它们是分开实现的(不同的结构位置,功能项目,结构等)。当心。