使用nltk进行POS标记需要时间

时间:2015-11-06 03:14:39

标签: nlp nltk

我正在尝试使用nltk获取POS标签,我认为处理小文本应该花费少于或大约1秒。但2-3句话需要20-25秒。

import nltk,re, time
def findPos( text):
    start_time = time.time()
    try:
        tokens = nltk.word_tokenize(text)
        pos_tags = nltk.pos_tag(tokens)
        print [ x[0] for x in pos_tags if x[1] == "NN" or "NNP"]
    except Exception:
        import traceback
        traceback.format_exc()
    print("--- %s seconds ---" % (time.time() - start_time))

findPos(raw_input())

有关如何减少时间的任何建议吗?

0 个答案:

没有答案