在python中仅从HTML页面获取数据

时间:2013-05-07 05:27:00

标签: python html parsing beautifulsoup

我正在开发一个项目,我需要给出一个HTML网页的内容给出了ts url。

我正在做这样的事情

con=urllib.request.urlopen(url)
a=con.read()
con.close()

soup = BeautifulSoup(a)


print(soup.get_text())

但问题是我得到了所有的java脚本,以及其他东西。我只需要显示网页的内容。关于如何去做的任何指示?

0 个答案:

没有答案