这是我原来的字符串:
string = '<div id="2">\n\t<h1 id="25"> id="234">\n\t\'
我想删除所有的id号,这样字符串就是:
string = '<div id="">\n\t<h1 id=""> id="">\n\t\'
基本上,我想删除之间的任何内容:
id="
和
"
答案 0 :(得分:4)
您可以使用re.sub
:
import re
string = '<div id="2">\n\t<h1 id="25"> id="234">\n\t'
final_data = re.sub('(?<=id\=")\d+(?=")', '', string)
输出:
'<div id="">\n\t<h1 id=""> id="">\n\t'
答案 1 :(得分:1)
我首先必须将它放入3个双引号中,否则我会收到错误:
string = """<div id="2">\n\t<h1 id="25"> id="234">\n\t\
...: """
import re
erase = re.compile(r'"\d+"')
string2 = erase.sub('""',string)
这样就可以替换双引号之间的所有数字。输出:
'<div id="">\n\t<h1 id=""> id="">\n\t'