如何使用CSS从单个href中的多个URL中选择单个URL?

时间:2018-07-29 14:23:57

标签: python url web-scraping scrapy

This是我要剪贴的图像。我想取消播放器的href,但是在输出中,我得到了单个播放器的两个URL。一个用于球员,另一个用于团队。我不想要第二个URL。

This是输出图像。

1 个答案:

答案 0 :(得分:1)

您可以检索所有URL,然后对它们进行排序,仅保留以/players/开头的URL。使用列表推导和startswith方法可以轻松地做到这一点。

urls = [url for url in urls if url.startswith("/players/")]

urls是您检索到的所有URL的数组。