PolyAnalyst:是否有部分词性标签的列表?

时间:2019-08-27 18:20:33

标签: nlp tagging pos-tagger part-of-speech

有人可以提供分配给创建的_tagged列的Pos Tagger标签的列表吗?我们需要知道所有可能分配的值以及每个值的含义。例如:En_NN = nounEn_NNS = plural noun

类似于_chunked列(NP,VP,PP等)

类似于_low_chunked / _top_chunked列(Np,Vp,Jp,Rp等)

1 个答案:

答案 0 :(得分:0)

_parsed-解析器的结果。每个标记用空格分隔,句子用空行分隔。

_tagged-后接合的结果。在每个令牌后都以斜杠作为其标记。标签的含义:

常见

SPEC |任何特殊符号

PUNCT |任何标点符号

粒子

En_NEG |否定符(不是)

En_TO |无限

En_AT |文章(一个)

En_OF |介词(在)

En_CC |并列协调(和或)

En_CS |连词从属(即为)

En_UH |感叹词(oops)

数字

En_CD |红衣主教(一个)

En_OD |序数(第一)

名词

En_NN |单数名词(猫)

En_NNS |复数主格(猫)

En_NN $ |奇异格(猫)

En_NNS $ |复数格(猫)

形容词

En_JJ |积极(热情)

En_JJR |比较(温暖)

En_JJT |最高级(最温暖)

副词

En_RB |积极(便宜)

En_RBR |比较(便宜)

En_RBT |最高级(最便宜)

动词

En_MD |情态(可能)

En_VB |不是第三或复数(去)

En_VBZ |第三单数(行)

En_VBD |过去时(过去)

En_VBN |过去分词(消失)

En_VBG |现在分词(去)

代词

En_PP |主格(他,她,我们)

En_PP $ |所有格(​​我们的,他的,我的,你的)

En_PPO |指责的(他们是他,我是我们,您是她,您)

En_PPL |反身(自己自己就是你自己)

_chunked,_low_chunked,_top_chunked-是分块算法的不同级别。 top_chunked-最上面的短语,它被构造成小的基本块的联合。

POS标记程序块标记为: NP-名词短语 VP-动词短语 JP-形容词短语 RP-副词短语 pp-介词短语 Sp-连词