我正在学习BeautifulSoup 4文档,并希望练习给出的示例。
我正在尝试这些例子,但它没有成功。以下是一个例子。
似乎我没有把它放在正确的方式,问题在于'url'。能有些善意向我展示正确的方式吗?感谢。
from bs4 import BeautifulSoup
import re
import urllib2
url = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
Learning = soup.find_all("a", class_="sister")
print Learning
答案 0 :(得分:2)
'<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'
不是网址。
代码包含html;您无需使用urllib2.urlopen
。
from bs4 import BeautifulSoup
page = '<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>'
soup = BeautifulSoup(page)
Learning = soup.find_all("a", class_="sister")
print Learning