我正在尝试仅从包含以下链接的HTML中选择http://lyricsindia.net/songs/show/*
类型的链接:
<a href="http://lyricsindia.net/songs/show/550" class=l>LyricsIndia.net dhiimii </a>
<a href="http://smriti.com/hindi-songs/dhiimii-dhiimii-bhiinii-bhiinii-utf8" class=l>dhiimii Songs Archive</a>
我已经阅读了Scrapy文档,但未能弄清楚这一点。有什么想法吗?
答案 0 :(得分:3)
试试这个XPath:
//a[starts-with(@href, 'http://lyricsindia.net/songs/show/')]