我刚刚开始使用python(3.x +)并试图找出如何从所有子节点(所以大孩子和伟大的子节点)中的XML文件中提取所有元素而不进行检查提取每个孩子后。
我无法硬编码,因为xml文件可能会更改。我只是想提取元素,它的父元素以及它是否有任何子元素。
答案 0 :(得分:0)
您是否尝试过使用Feedparser模块并编写迭代for循环,可以向下钻取到您想要提取的XML节点?
例如,您可以执行以下操作:
import feedparser
d = feedparser.parse(r'c:\incoming\atom10.xml') #this is your locally hosted XML file
for index, post in enumerate(d.entries):
if index >= 5:
break
print(post.title) #replace 'title' with the name of the node you want in your XML file, etc
print(post.summary)
print(post.media_keywords)
根据您希望在XML文件中提取的内容,您必须稍微使用脚本。查看documentation了解更多详情。