Python中的美丽汤XML解析问题

时间:2018-06-18 07:02:25

标签: python beautifulsoup xml-parsing

我有这个我希望解析的xml文件。 这是我写的代码。但是它似乎无法解析文件,因为它不输出任何文件。

from bs4 import BeautifulSoup
f=open("1.txt",'r')
y=BeautifulSoup(f, "lxml-xml")
print(y.url)

输出

None

2 个答案:

答案 0 :(得分:0)

由于您当前尝试打开文件的方式而出现第一个问题,因此请尝试将f=open("1.txt",'r')替换为f=open("1.txt",'r').read()

我还建议您将print(y.url)更改为print(y.find_all('url'))。 希望这有帮助

答案 1 :(得分:0)

使用xml.etree.ElementTree解析XML数据

示例XML文件

<root_element>
    <url>This is my URL</url>
    <url>This is my 2nd URL</url>
</root_element>

Python代码

import xml.etree.ElementTree as ET
path = r"Full_Path of your xml file"
tree = ET.parse(path)
root = tree.getroot()
url=root.findall('url')
url[0].text
url[1].text

输出

&#39;这是我的网址&#39; &#39;这是我的第二个网址&#39;