Python:查找和替换XML标记类型的属性值的最佳方法是什么?

时间:2014-10-21 10:11:58

标签: python xml regex

对于某些属性,我希望验证这些值,并用更简洁的值替换其中的一些。

<data source="file:\\c:\main\data.txt"/>

替换为:

<data source="c:\main\data.txt"/>

1 个答案:

答案 0 :(得分:1)

我认为您可以使用BeautifulSoup,您可以使用它来解析和修改xml文件:

>>> s=r'''<data source="file:\\c:\main\data.txt"/>'''
>>> soup = BeautifulSoup(s)
>>> t = soup.find("data")
>>> t['source']
'file:\\\\c:\\main\\data.txt'
>>> t['source'][7:]
'c:\\main\\data.txt'
>>> t['source'] = t['source'][7:]
>>> print str(soup)
<html><body><data source="c:\main\data.txt"></data></body></html>