按名称搜索本地html文件

时间:2018-02-14 13:36:47

标签: python html beautifulsoup

我有200个学术期刊文章的文件夹,保存为单独的html文件。我想写一个Python程序,要求用户输入文件名,文件将打开,以便可以用漂亮的汤处理。任何人都可以帮我这么做吗?

1 个答案:

答案 0 :(得分:0)

在Python 2.x中,可以按如下方式完成:

from bs4 import BeautifulSoup

filename = raw_input('Please enter filename: ')

with open(filename) as f_input:
    html = f_input.read()

soup = BeautifulSoup(html, "html.parser")

print soup