我正在使用Python,我想删除网址中的空格,以便恢复损坏的链接。
这是我必须处理的典型案例。
关于某些内容的文字 https:// sr.a i / gMF
链接在斜杠(/)后面有一个空格,可以预期。但它也可以随机分布其他空格。
首先,我想修复斜杠(/)
后面的空格.replace('/ ', '//')
此代码可以在斜杠后立即替换空格,但是如果空白区域出现在任何其他地方,有没有办法修复链接而不删除所有空格,因为我需要保留其含义文字?
答案 0 :(得分:2)
使用string.replace()
功能,只需用空字符串替换为空格。
>>> my_string = "https:// sr.a i/gMF"
>>> my_string
'https:// sr.a i/gMF'
>>> my_string.replace(" ","")
'https://sr.ai/gMF'
答案 1 :(得分:2)
使用带有以下正则表达式的正则表达式lib https://docs.python.org/3.6/library/re.html
import re
text = re.sub(r"[/]\s", "/", text)
# r"" --> regexp in python
# [/] --> slash
# \s --> blank
在这个online regexp editor中,您可以围绕使某些角落情况下的正则表达式更稳定
答案 2 :(得分:1)
也许.replace(' ','')
有效。如果有很多空格,import re
(正则表达式)会对你有帮助。