从python中的文本文件中删除特定项目

时间:2018-08-08 03:00:50

标签: python python-3.x python-2.7

我想删除python文本文件中的特定项目。例如,在我的文本文件中说:

<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>

我要删除标签<td>以显示:

Zulfahmi, 081354, Fachrial, 0823, 203188

我该怎么做?

2 个答案:

答案 0 :(得分:4)

只需使用正则表达式

from re import sub
text = """<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"""
text = sub('<(/*)td>', '', text)

或仅使用replace

text = """<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"""
text = text.replace('<td>', '').replace('</td>', '')

编辑

要在文件中使用

from re import sub
with open(filname,'r+') as f:
    text = f.read()
    f.write(sub('<(/*)td>','',text))

答案 1 :(得分:1)

或者:

import re
with open(filname,'r') as f:
    s=f.read()
    s2=re.sub('</*td>','',s)
with open(filename2,'w') as f:
    f.write(s2)

文件:

Zulfahmi, 081354, Fachrial, 0823, 1203188

如果要对字符串进行操作,请执行以下操作:

import re
s="<td>Zulfahmi</td>, <td>081354</td>, <td>Fachrial</td>, <td>0823</td>, <td>1203188</td>"
print(re.sub('</*td>','',s))