如何在大量数据上实现词形还原?

时间:2014-09-17 18:20:27

标签: python machine-learning nlp nltk lemmatization

我需要对大量数据(约1000万行)实现词形还原。 Python nltk库在大量数据上非常慢。还有其他选择吗?

1 个答案:

答案 0 :(得分:0)

使用clearNLP或stanford-coreNLP。 clearNLP(http://clear.colorado.edu/compsem/)要快得多。