如何使用XPath和amp;选择特定类型的URL? Scrapy

时间:2011-10-01 13:50:25

标签: python xml regex xpath scrapy

我正在尝试仅从包含以下链接的HTML中选择http://lyricsindia.net/songs/show/*类型的链接:

<a href="http://lyricsindia.net/songs/show/550" class=l>LyricsIndia.net dhiimii </a>
<a href="http://smriti.com/hindi-songs/dhiimii-dhiimii-bhiinii-bhiinii-utf8" class=l>dhiimii Songs Archive</a>

我已经阅读了Scrapy文档,但未能弄清楚这一点。有什么想法吗?

1 个答案:

答案 0 :(得分:3)

试试这个XPath:

//a[starts-with(@href, 'http://lyricsindia.net/songs/show/')]