Python BeautifulSoup 4文档中给出的示例

时间:2014-01-20 03:08:44

标签: python beautifulsoup

我正在学习BeautifulSoup 4文档,并希望练习给出的示例。

我正在尝试这些例子,但它没有成功。以下是一个例子。

似乎我没有把它放在正确的方式,问题在于'url'。能有些善意向我展示正确的方式吗?感谢。

from bs4 import BeautifulSoup
import re
import urllib2


url = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'

page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())

Learning = soup.find_all("a", class_="sister")

print Learning

1 个答案:

答案 0 :(得分:2)

'<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'不是网址。

代码包含html;您无需使用urllib2.urlopen

from bs4 import BeautifulSoup

page = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'
soup = BeautifulSoup(page)
Learning = soup.find_all("a", class_="sister")
print Learning