我正在尝试使用nltk获取POS标签,我认为处理小文本应该花费少于或大约1秒。但2-3句话需要20-25秒。
import nltk,re, time
def findPos( text):
start_time = time.time()
try:
tokens = nltk.word_tokenize(text)
pos_tags = nltk.pos_tag(tokens)
print [ x[0] for x in pos_tags if x[1] == "NN" or "NNP"]
except Exception:
import traceback
traceback.format_exc()
print("--- %s seconds ---" % (time.time() - start_time))
findPos(raw_input())
有关如何减少时间的任何建议吗?