table = soup.find(" table",{" class":" infobox ww_ib ww_ib_1"})无效

时间:2018-05-15 20:41:30

标签: web-scraping beautifulsoup wikipedia wikipedia-api

我试图解析在这个位置给出的表:" http://en.wikipedia.org/wiki/Quartz" 属性表标识为class = infobox ww_ib ww_ib_1。 我期望获得表中给出的值,例如: '类别,氧化物,化学式等..." 但是,该表返回None类型。 有人可以帮助我吗?

from bs4 import BeautifulSoup
import requests
wiki = "http://en.wikipedia.org/wiki/Quartz"
header = {'User-Agent': 'Mozilla/5.0'}
req = requests.get(wiki,headers=header)
soup = BeautifulSoup(req.content)
table = soup.find("table", { "class" : "infobox ww_ib ww_ib_1" })
print (table)

如果你知道刮掉维基百科的更好方法,请告诉我!

1 个答案:

答案 0 :(得分:0)

我能够弄清楚问题是什么。表的类只是'infobox'而不是'infobox ww_ib ww_ib_1'