使用Python和Beautiful Soup进行数据抓取

时间:2016-01-16 00:11:49

标签: python python-2.7 beautifulsoup python-2.x

我目前正在使用Python&美丽的汤,以便从俄罗斯统计网站获取数据。

在Stack Overflow上查看不同的示例,我认为代码是正确的,但我的简单查询不会从此站点返回任何内容。执行代码时,我的Python命令行保持空白,但也不会返回错误。

这里有什么问题?

我的(非常简单)代码:

from bs4 import BeautifulSoup
import urllib2
url = "http://www.gks.ru/bgd/free/B00_25/IssWWW.exe/Stg/d000/000715.HTM"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
print(soup)

1 个答案:

答案 0 :(得分:3)

您需要指定一个解析器:

soup = BeautifulSoup(page.read(), 'html.parser')