我想以IEER语料库格式制作我的文本文件,以便我可以直接使用函数extract_rels()
和parsed_docs()
。怎么做?我正在使用python和NLTK。
ws = nltk.corpus.reader.ieer.IEERCorpusReader(corpus_root, 'doc1.txt')
print ws.fileids() #ws is a instantaneous of ieer corpus
RELATION=re.compile(r'\bin\b')
for t in ws.fileids():
for doc in ws.parsed_docs(t):
for rel in nltk.sem.extract_rels('PER', 'LOC', doc , corpus='ieer', pattern=RELATION):
print nltk.sem.clause(rel, relsym= 'RELATION' )
我这样做但没有输出,也没有错误..
doc1.txt
Peter in India. Ajay in London. John in Madrid