从POS标记结果中检索标记

时间:2015-03-16 09:52:37

标签: python tagging

使用python如何只检索标签 - 来自

的'NN','JJ'等
('[', 'NN'), 
("u'Tradus-Under", 'NN'), 
("'", "''"), 
(',', ','), 
("u'Maintenance", 'JJ'), 
("'", "''"), 
(']', ':')

即。来自POS标记结果。

1 个答案:

答案 0 :(得分:0)

假设这些元素在列表中(我称之为列表lst):

import string
lst = [
    ('[', 'NN'),
    ("u'Tradus-Under", 'NN'),
    ("'", "''"),
    (',', ','),
    ("u'Maintenance", 'JJ'),
    ("'", "''"),
    (']', ':')
]

tags = []
for _,poss_tag in lst:
    if(len(poss_tag) == 2 and 
           poss_tag[0] == poss_tag[1] and 
           poss_tag[0] in string.ascii_letters):
        tags.append(poss_tag)

print(tags)

输出:

['NN', 'NN', 'JJ']

如果你想要一套独特的套装,你可以将它弹回到一套,然后回来:

print(list(set(tags)))

输出:

['JJ', 'NN']