我对XML和python有疑问。我想梳理这个xml文件并查找某些标签,然后在这些标签中查找有逗号分隔的数据的位置。拆分并创建一条新线。我有逻辑,我只是不太熟悉python知道我应该研究的模块。关于我应该从哪里开始研究的任何帮助都会有所帮助。
172.28.18.142,10.0.0.2
感谢
答案 0 :(得分:0)
我认为在python中进行xml解析时,有几个选项:lxml
,xml
和BeautifulSoup
。我的大多数经验都涉及前两个,我发现lxml
比xml
快得多。这是一个lxml
代码片段,用于使用特定标记解析根的所有元素,并将每个标记的逗号分隔文本存储为列表。我想你会想要添加很多try
和except
块并修补细节,但这应该可以让你开始。
from lxml import etree
file_path = r'C:\Desktop\some_file.xml'
tree = etree.parse(file_path)
info_list = []
my_tag_path = tree.xpath('//topTag')
for elem in my_tag_path:
if elem.find('.//childTag') is not None:
info_list.append(elem.xpath('.//childTag')[0].text.split(','))