def pre_process(t):
""" (str) -> str
returns a copy of the string with all punctuation removed, and all letters set to lowercase. The only characters in the output will be lowercase letters, numbers, and whitespace.
"""
答案 0 :(得分:1)
请尝试以下代码。
import re
string = 'This is an example sentence.'
string = re.sub(r'[^a-zA-Z\d]', string)
print(string)
你应该离开Thisisanexamplesentance
。
答案 1 :(得分:0)
只需使用字母数字字符重建字符串:
''.join(_char for _char in _str.lower() if _char.isalnum())
答案 2 :(得分:0)
这是使用regex
的最简单的功能,我可以将它组合在一起以达到您的要求。
import re
def pre_process(t):
return re.sub(r'[^a-z\d ]','',str.lower())
它将以小写形式返回输入字符串,并省略任何不是字母,数字或空格的字符。