标签: python url web-scraping scrapy
This是我要剪贴的图像。我想取消播放器的href,但是在输出中,我得到了单个播放器的两个URL。一个用于球员,另一个用于团队。我不想要第二个URL。
This是输出图像。
答案 0 :(得分:1)
您可以检索所有URL,然后对它们进行排序,仅保留以/players/开头的URL。使用列表推导和startswith方法可以轻松地做到这一点。
/players/
startswith
urls = [url for url in urls if url.startswith("/players/")]
urls是您检索到的所有URL的数组。
urls