我有200个学术期刊文章的文件夹,保存为单独的html文件。我想写一个Python程序,要求用户输入文件名,文件将打开,以便可以用漂亮的汤处理。任何人都可以帮我这么做吗?
答案 0 :(得分:0)
在Python 2.x中,可以按如下方式完成:
from bs4 import BeautifulSoup
filename = raw_input('Please enter filename: ')
with open(filename) as f_input:
html = f_input.read()
soup = BeautifulSoup(html, "html.parser")
print soup