在NLTK中以表格格式提取数据

时间:2015-07-06 15:08:33

标签: nltk

import nltk
from nltk.tag import pos_tag, map_tag
import re 

Text = open('aaa.txt')
t = Text.read()
print t
text = nltk.word_tokenize(t);
posTagged = pos_tag(text)
simpTags = [(word, map_tag('en-ptb','universal',tag)) for word,tag in posTagged]
sentence1 = simpTags
grammar1 = "NP: {<DET>?<ADJ>*<NOUN>}"
cp1 =  nltk.RegexpParser(grammar1)
result1 = cp1.parse(sentence1)
print result1

我想提取实体关系,这段代码准确地给出了输出。我想要的是以TABULAR格式呈现它,以便我可以使用数据在数据库中创建一个表。以这种格式出现的(Entity1,Relation,Entity2)对我来说已经足够了。但我不知道该怎么做。

0 个答案:

没有答案