标签: python pandas nlp
当前,我有:
[re.sub(r'\W', '', i) for i in training_data.loc[:, 'Text']]
但是与此同时,印地语字符仍然保留,所有空格都被删除。有什么想法吗?
答案 0 :(得分:0)
否定可能会帮助
import re import string re.sub(f'[^{string.printable}]', '', 'asdf #$שדגכ')