如何获取BeautifulSoup Xml Parser的数据

时间:2010-06-21 09:35:14

标签: beautifulsoup xml-parsing

我正在尝试使用BeautifulSoup解析XML文件。在网上的所有教程中,xml的内容都像

一样
xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)

但我想只提供xml文件的路径。在机械化中,可以使用get_data()方法,但它仅适用于html文件。任何sugestions?

1 个答案:

答案 0 :(得分:0)

BeautifulSoup documentation说:

“Beautiful Soup构造函数以字符串形式(或类似于打开文件的对象)获取XML或HTML文档。它解析文档并在内存中创建相应的数据结构。”

在您的问题的表述中,您使用BeautifulStoneSoup,尽管在线文档使用字符串,但构造函数的docstring显示:

“Soup对象被初始化为'根标签',并且提供的标记(可以是字符串或类似文件的对象)被送入底层解析器。”