需要帮助来提取人的名字

时间:2019-05-02 04:05:09

标签: python web-scraping beautifulsoup python-requests

我正在从网站中提取数据,我想以适当的形式获取学生的姓名。

如何更改\xa0 RAJAT KUMAR\r\n ' 进入RAJAT KUMAR

1 个答案:

答案 0 :(得分:0)

您可以使用strip()来帮助您。

string = '\xa0  RAJAT KUMAR\r\n                                '
print(string.strip())
# RAJAT KUMAR

如果失败,请尝试使用此功能。

def RemoveMeta(string):
    import re
    string = re.sub('\s+',' ',string)
    string = re.sub('\n|\t|^\s+\|\s+$','',string)
    string = string.strip()
    return string
print(RemoveMeta(string))
# RAJAT KUMAR

如果您有任何编码或文本问题,也可以在下面添加内容,这对您有帮助

import ftfy
string = ftfy.fix_text(string)