有人可以提供分配给创建的_tagged
列的Pos Tagger标签的列表吗?我们需要知道所有可能分配的值以及每个值的含义。例如:En_NN = noun
,En_NNS = plural noun
等
类似于_chunked
列(NP,VP,PP等)
类似于_low_chunked
/ _top_chunked
列(Np,Vp,Jp,Rp等)
答案 0 :(得分:0)
_parsed-解析器的结果。每个标记用空格分隔,句子用空行分隔。
_tagged-后接合的结果。在每个令牌后都以斜杠作为其标记。标签的含义:
SPEC |任何特殊符号
PUNCT |任何标点符号
En_NEG |否定符(不是)
En_TO |无限
En_AT |文章(一个)
En_OF |介词(在)
En_CC |并列协调(和或)
En_CS |连词从属(即为)
En_UH |感叹词(oops)
En_CD |红衣主教(一个)
En_OD |序数(第一)
En_NN |单数名词(猫)
En_NNS |复数主格(猫)
En_NN $ |奇异格(猫)
En_NNS $ |复数格(猫)
En_JJ |积极(热情)
En_JJR |比较(温暖)
En_JJT |最高级(最温暖)
En_RB |积极(便宜)
En_RBR |比较(便宜)
En_RBT |最高级(最便宜)
En_MD |情态(可能)
En_VB |不是第三或复数(去)
En_VBZ |第三单数(行)
En_VBD |过去时(过去)
En_VBN |过去分词(消失)
En_VBG |现在分词(去)
En_PP |主格(他,她,我们)
En_PP $ |所有格(我们的,他的,我的,你的)
En_PPO |指责的(他们是他,我是我们,您是她,您)
En_PPL |反身(自己自己就是你自己)
_chunked,_low_chunked,_top_chunked-是分块算法的不同级别。 top_chunked-最上面的短语,它被构造成小的基本块的联合。
POS标记程序块标记为: NP-名词短语 VP-动词短语 JP-形容词短语 RP-副词短语 pp-介词短语 Sp-连词