Scrapy-具有正则表达式的xpath

时间:2019-06-26 02:50:54

标签: python regex scrapy

我用id = Content_Main_随机数的某些div抓取了一个页面,但由于结果始终为空,所以无法使用以下xpath来获取其内容,这是我做错了吗?

//div[re:test(@id, '([Content_Main_]+\d{5}[0-9])')]

/div[@id='Content_Main_4']
/div[@id='Content_Main_5']
/div[@id='Content_Main_8']

2 个答案:

答案 0 :(得分:0)

我认为您需要类似的东西(从Content_Main_到下一个digit):

//div[re:test(@id, 'Content_Main_\d+')]

更新 要选择以数字结尾的div,您需要:

//div[re:test(@id, 'Content_Main_\d+$')]

答案 1 :(得分:0)

您正要在文本(Content_Main_)之后搜索五个Digt \ d {5}-搜索5位数字示例:12345; 76543 ....

使其类似于: \ d-如果始终为一位 要么 \ d +-如果可以包含一个或多个数字 要么 \ d *-如果可能/可能没有数字