无论我使用什么html文件,我的输出都是重复b''。
from bs4 import BeautifulSoup
html_doc = "C:/Users/George/Desktop/bsTest"
soup = BeautifulSoup(html_doc, 'html.parser')
print(soup.prettify())
有人可以帮我解决这个问题吗?
答案 0 :(得分:1)
您不能像尝试那样传递文件路径。请参阅文档here。
with open("C:/Users/George/Desktop/bsTest") as fp:
soup = BeautifulSoup(fp, 'html.parser')
答案 1 :(得分:0)
尝试解析变量之前尝试打开文档。
from bs4 import BeautifulSoup
html_doc = "C:/Users/George/Desktop/bsTest"
soup = BeautifulSoup(open(html_doc).read(), 'html.parser')
print(soup.prettify())