在我看到的BeautifulSoup的所有示例和教程中,传递了一个HTML / XML文档,并返回了一个汤对象,然后可以使用该对象来修改文档。但是,如何使用BeautifulSoup从头开始创建HTML / XML文档?换句话说,我有数据要放在XML文件中,但XML文件还不存在,我想从头开始构建它。我怎么能去做呢?
答案 0 :(得分:7)
只需创建一个空的BeautifulSoup()
对象:
soup = BeautifulSoup()
并开始添加元素:
soup.append(soup.new_tag("a", href="http://www.example.com"))
对于XML,您可以使用xml
树构建器
soup = BeautifulSoup(features='xml')
这需要先安装lxml。这会在.is_xml
对象上设置BeautifulSoup
标志(也可以手动设置)。