标签: python machine-learning nlp nltk lemmatization
我需要对大量数据(约1000万行)实现词形还原。 Python nltk库在大量数据上非常慢。还有其他选择吗?
答案 0 :(得分:0)
使用clearNLP或stanford-coreNLP。 clearNLP(http://clear.colorado.edu/compsem/)要快得多。