Q1.I我试图让一个完整的句子变得紧张,只是不知道如何使用nlp来完成它。 任何帮助表示赞赏。
Q2。使用nlp可以从句子中提取所有信息吗?
目前我可以, 我得到:1。判决的声音 2.subject对象动词 3.POS标签。
可以提取更多信息,请告知我们。
答案 0 :(得分:16)
Penn树库分别将VBD
和VBN
定义为动词的过去时和过去分词。在许多句子中,只需获取POS标签并检查这两个标签的存在就足够了。然而,在其他情况下,可能存在多个时态的动词,而整个句子是过去时态。对于这些情况,您需要使用选区解析。斯坦福NLP还提供了解析器。您可以使用它来检测最外面的动词短语(标记为VP
)。如果动词的过去时/分词形式是动词短语中所有其他动词的祖先,则应将句子的时态标记为过去时。
Dror给出的例子产生了这个:
(ROOT
(S
(NP (PRP I))
(VP (VBD did) (RB n't)
(VP (VB want)
(NP (DT the) (NN dog)
(S
(VP (TO to)
(VP (VB eat)
(NP (PRP$ my) (NN homework))))))))
(. .)))
即使 eat 未过去时,动词短语中最顶端的动词也会被正确标记VBD
(即过去时)。
编辑(一些其他信息):
复杂句子具有所谓的主要时态和次要时态。对于像“当我到达那里,他已经离开”这样的句子,没有“完全时态”这样的东西。您只能区分主要和次要。
如果您需要有关完美,连续等的信息,那么您必须根据POS标记派生规则。例如。现在时的辅助动词后跟过去时的动词将表达现在的完成时(如果有明显的反例,请加上答案......我现在想不到任何一个)。
答案 1 :(得分:3)
基本上,英语句子的时态由句子头部的动词形式决定。您可以在此帖子中了解有关The Contextors’ Tense Conjugator的更多相关信息。使用解析器可以识别头部动词及其形式。
可以从句子中提取的信息类型取决于您执行的分析。您可以提取句子的其他组成部分,如介词补语,预测补语和辅助,以及其他语法属性,如方面,次要时,模态和极性。有些句子包含嵌入式子句,如下面Contextors API中的示例所示。在这种情况下,您可能还想从嵌入式子句中提取此信息。
答案 2 :(得分:2)
我想要完整时态,例如:简单呈现或呈现完美连续 紧张......据我所知,我不能简单地从POS标签中获取
请注意,上面示例中的内容不是时态的示例,而是某些时态/方面配置的示例。虽然时态紧张(过去,现在,将来)会产生时间上的可能性,但是方面类别(渐进的,连续的,完整的等等)却将可能性与时间流程联系起来(即它是否有界/完成,是否是一个连续的事件,等等。因此,时态和方面是两个不同的语法范畴。在英语中,它们都是语言复合体的一部分,这使得它们很容易混淆,并且可以用一种方法查找/分析它们。在许多其他语言中,它们是分开实现的(不同的结构位置,功能项目,结构等)。当心。