python在xtree标签名称中插入架构URL

时间:2018-07-27 20:54:29

标签: xml python-3.x elementtree

我是具有Python经验的Python新手。我的脚本正在解析一些公共XML文件,这些文件是“站点地图”到内容集合,例如https://www.ibm.com/support/knowledgecenter/SSGU8G_11.70.0/sitemap.xml.gz

当我使用.tag函数获取标签名称时,它将返回一个带有'sitemap'模式的完整字符串。例如:

import xml.etree.ElementTree as ET
root = ET.fromstring(content)
for child in root:
    print(child.tag)

导致:

{http://www.sitemaps.org/schemas/sitemap/0.9}sitemap

当我想要的是:

sitemap

为了搜索这些标记/路径,我需要包括整个{}字符串,否则将找不到它们。

也许与我的html.client通话有关?

conn = http.client.HTTPSConnection("www.ibm.com")
conn.request("GET", url)
r1 = conn.getresponse()
content = r1.read()

我在在线文档中没有看到任何内容-我缺少什么吗?谢谢。

0 个答案:

没有答案