我正在从网站中提取数据,我想以适当的形式获取学生的姓名。
如何更改\xa0 RAJAT KUMAR\r\n '
进入RAJAT KUMAR
。
答案 0 :(得分:0)
您可以使用strip()来帮助您。
string = '\xa0 RAJAT KUMAR\r\n '
print(string.strip())
# RAJAT KUMAR
如果失败,请尝试使用此功能。
def RemoveMeta(string):
import re
string = re.sub('\s+',' ',string)
string = re.sub('\n|\t|^\s+\|\s+$','',string)
string = string.strip()
return string
print(RemoveMeta(string))
# RAJAT KUMAR
如果您有任何编码或文本问题,也可以在下面添加内容,这对您有帮助
import ftfy
string = ftfy.fix_text(string)