假设我有一个像
这样的字符串s=""" Bob sent some money to Ana. It was 10.23 dollars. Ana thanked him.
"""
我希望输出为
Bob sent some money to Ana. It was dollars. Ana thanked him.
所以基本上只保留字母和句号,这标志着句子的结束。删除非字母字符以及数字之间的句点。
我正在尝试使用
re.sub(r"[^A-za-z.\n]"," ",s)
但这显然会使时间介于两者之间。并给出
' Bob sent some money to Ana. It was . dollars. Ana thanked him. \n\n'
我想删除数字之间的句点,因为稍后我想将文本字符串分解为句子,并且会查找句点或\ n作为句子的结尾。有一个十进制数的一部分的句号也将使用该句号打破句子,这是不理想的