标签: python nlp text-mining spacy
查找和替换串联词的常用方法有哪些:
brokenleg -> (broken,leg)
该方法应该在数千行上运行,而无需事先知道那里是否存在串联词。
我大多数情况下都使用SpaCy库处理字符串,因此最好的方法是与SpaCy一起很好地工作。