Python:删除字符串中特定字符集后面的任何字符

时间:2017-09-26 13:41:44

标签: python string

这是我原来的字符串:

string = '<div id="2">\n\t<h1 id="25"> id="234">\n\t\'

我想删除所有的id号,这样字符串就是:

string = '<div id="">\n\t<h1 id=""> id="">\n\t\'

基本上,我想删除之间的任何内容:

id="

"

2 个答案:

答案 0 :(得分:4)

您可以使用re.sub

import re
string = '<div id="2">\n\t<h1 id="25"> id="234">\n\t'
final_data  = re.sub('(?<=id\=")\d+(?=")', '', string)

输出:

'<div id="">\n\t<h1 id=""> id="">\n\t'

答案 1 :(得分:1)

我首先必须将它放入3个双引号中,否则我会收到错误:

string = """<div id="2">\n\t<h1 id="25"> id="234">\n\t\
...: """
import re
erase = re.compile(r'"\d+"')
string2 = erase.sub('""',string)

这样就可以替换双引号之间的所有数字。输出:

'<div id="">\n\t<h1 id=""> id="">\n\t'