使用Beautiful Soup 4我创建了一些可以从网页中抓取在线数据的代码。在这个例子中,我试图从表中读取数据,但只希望它来自表中的特定行,在本例中是第4行。我想知道是否有一个参数可以传递给.find()
参数,该参数会忽略tr
的前3个实例,以便它只返回第四行。
到目前为止我的尝试是:
soup = BeautifulSoup(page.content,"html.parser")
weather = soup.find_all('tr', limit=4)
然后我就打算使用此列表中的最后一个索引,但是我想知道是否有更好的方法来获取tr
的第4个外观
答案 0 :(得分:2)
我觉得这样的事情会起作用
soup = BeautifulSoup(page.content,"html.parser")
weather = soup.find_all('tr')[3]
因为find_all返回一个列表,你可以用索引来控制它。因此,如果您想要第4行,请使用3索引,如果第5行使用4,依此类推......