我有以下bs4对象列表:
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
我想将原始html提取为字符串。我试过了:
>>> a = listing.contents
>>> type(a)
<type 'list'>
所以这不起作用。我怎么能这样做?
答案 0 :(得分:80)
html_content = str(listing)
这是一个非美化版本。
如果你想要一个美化的方法,请使用prettify()
方法:
html_content = listing.prettify()