我是具有Python经验的Python新手。我的脚本正在解析一些公共XML文件,这些文件是“站点地图”到内容集合,例如https://www.ibm.com/support/knowledgecenter/SSGU8G_11.70.0/sitemap.xml.gz
当我使用.tag函数获取标签名称时,它将返回一个带有'sitemap'模式的完整字符串。例如:
import xml.etree.ElementTree as ET
root = ET.fromstring(content)
for child in root:
print(child.tag)
导致:
{http://www.sitemaps.org/schemas/sitemap/0.9}sitemap
当我想要的是:
sitemap
为了搜索这些标记/路径,我需要包括整个{}字符串,否则将找不到它们。
也许与我的html.client
通话有关?
conn = http.client.HTTPSConnection("www.ibm.com")
conn.request("GET", url)
r1 = conn.getresponse()
content = r1.read()
我在在线文档中没有看到任何内容-我缺少什么吗?谢谢。