BeautifulSoup输出总是“b”'“

时间:2017-06-27 15:37:48

标签: python html beautifulsoup

无论我使用什么html文件,我的输出都是重复b''。

from bs4 import BeautifulSoup
html_doc = "C:/Users/George/Desktop/bsTest"
soup = BeautifulSoup(html_doc, 'html.parser')

print(soup.prettify())

有人可以帮我解决这个问题吗?

2 个答案:

答案 0 :(得分:1)

您不能像尝试那样传递文件路径。请参阅文档here

with open("C:/Users/George/Desktop/bsTest") as fp: soup = BeautifulSoup(fp, 'html.parser')

答案 1 :(得分:0)

尝试解析变量之前尝试打开文档。

from bs4 import BeautifulSoup
html_doc = "C:/Users/George/Desktop/bsTest"
soup = BeautifulSoup(open(html_doc).read(), 'html.parser')

print(soup.prettify())