我不确定在哪里犯了小错误,但是我想从文本中删除所有特殊字符,包括数字。
我用了这个:
def remove_special_chars(text):
""" Method to remove special characters
"""
print("original Text: {}\n".format(text))
pattern=r'[^a-zA-z.\s]'
text=re.sub(pattern,"",text)
print("Modified text: {}".format(text))
我明白了:
remove_special_chars("Hi How_abc.com_are you!. hello_123@gmail.com?_")
original Text: Hi How_abc.com_are you!. hello_123@gmail.com?_
Modified text: Hi How_abc.com_are you. hello_gmail.com_
因此,尽管其他所有功能似乎都可以正常工作,但我不确定为什么在字符类中不存在_时也不会将其删除?