如何在包含空格的序列中删除包含字符串的非字母数字(英语)字符?

时间:2019-03-05 23:59:08

标签: python pandas nlp

当前,我有:

[re.sub(r'\W', '', i) for i in training_data.loc[:, 'Text']]

但是与此同时,印地语字符仍然保留,所有空格都被删除。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

否定可能会帮助

import re
import string    

re.sub(f'[^{string.printable}]', '', 'asdf #$שדגכ')