Question

我正在尝试使用BeautifulSoup解析XML文件。在网上的所有教程中，xml的内容都像

一样

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)

但我想只提供xml文件的路径。在机械化中，可以使用get_data（）方法，但它仅适用于html文件。任何sugestions？

Answer 1

BeautifulSoup documentation说：

“Beautiful Soup构造函数以字符串形式（或类似于打开文件的对象）获取XML或HTML文档。它解析文档并在内存中创建相应的数据结构。”

在您的问题的表述中，您使用BeautifulStoneSoup，尽管在线文档使用字符串，但构造函数的docstring显示：

“Soup对象被初始化为'根标签'，并且提供的标记（可以是字符串或类似文件的对象）被送入底层解析器。”