我想删除python文本文件中的特定项目。例如,在我的文本文件中说:
<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>
我要删除标签<td>
以显示:
Zulfahmi, 081354, Fachrial, 0823, 203188
我该怎么做?
答案 0 :(得分:4)
只需使用正则表达式
from re import sub
text = """<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"""
text = sub('<(/*)td>', '', text)
或仅使用replace
text = """<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"""
text = text.replace('<td>', '').replace('</td>', '')
编辑
要在文件中使用
from re import sub
with open(filname,'r+') as f:
text = f.read()
f.write(sub('<(/*)td>','',text))
答案 1 :(得分:1)
或者:
import re
with open(filname,'r') as f:
s=f.read()
s2=re.sub('</*td>','',s)
with open(filename2,'w') as f:
f.write(s2)
文件:
Zulfahmi, 081354, Fachrial, 0823, 1203188
如果要对字符串进行操作,请执行以下操作:
import re
s="<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"
print(re.sub('</*td>','',s))