标签: nlp stanford-nlp
我正在尝试处理1M行的文本文件。每个字符串都是一行,我需要从每个字符串中获取位置信息。我想到的最简单的方法是在PYTHON中使用斯坦福的NER标记器。
但是,标记器的执行速度非常慢,例如每行2秒。按此速度完成我的文件需要20天。还有一些不准确,缺少明显的位置,如“纽约”。
任何人都知道如何加快速度并使其更准确?
由于