我正在尝试使用BeautifulSoup解析XML文件。在网上的所有教程中,xml的内容都像
一样xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3"
soup = BeautifulStoneSoup(xml)
但我想只提供xml文件的路径。在机械化中,可以使用get_data()方法,但它仅适用于html文件。任何sugestions?
答案 0 :(得分:0)
BeautifulSoup documentation说:
“Beautiful Soup构造函数以字符串形式(或类似于打开文件的对象)获取XML或HTML文档。它解析文档并在内存中创建相应的数据结构。”
在您的问题的表述中,您使用BeautifulStoneSoup
,尽管在线文档使用字符串,但构造函数的docstring显示:
“Soup对象被初始化为'根标签',并且提供的标记(可以是字符串或类似文件的对象)被送入底层解析器。”