美丽的汤经典混乱

时间:2017-02-14 18:33:29

标签: python css beautifulsoup

使用Python和Beautifulsoup。 CSS标记有点新,所以我知道我犯了一些初学者的错误,一个具体的例子可以帮助我理解。

我正在尝试抓取一个链接页面,但只有某些链接。

CSS

links = soup.find_all("a", class_="details-title")

1 个答案:

答案 0 :(得分:0)

您拥有的代码将搜索details-title类的链接,这些链接在您提供的示例中不存在。您似乎正在尝试使用details-title类找到位于div内的链接。我认为最简单的方法是使用CSS选择器进行搜索,您可以使用Beautiful Soup的.select方法进行搜索。

示例:links = soup.select("div.details-title a")

<tag>.<class>语法搜索具有该类的所有标记,并且用空格分隔的元素将在其之前搜索结果的子元素。有关详细信息,请参阅here