我正在尝试为id="1140"
搜索以下XML代码,并在id之后返回子对象。以下是XML文档的示例
<?xml version="1.0" encoding="utf-8"?>
<location france="paris">
<loc name="tower" id="1140">
<visit date="17.06.2013" time="12:00">
<visit status="set" date="17.06.2013" time="12:00" loc="Court" id="6711709">
<visit name="A. Hill" male="True" paid="40" confirmed="1" id="1627" />
<visit name="D. Hill" male="False" paid="40" confirmed="1" id="1627" />
</data>
这不是HTML文档,而是XML网页。有谁知道提取我需要的数据的最佳方法?
答案 0 :(得分:1)
使用XML解析器。例如,Beautiful Soup是一个不错的选择。无论你做什么,不要试图通过直接操作字符串或使用正则表达式来提取信息 - 这将是一个很大的麻烦,并且解析器是为此设计的,它们是这项工作的正确工具。