Scrapy / XPATH:在图片网址中查找子字符串

时间:2018-01-18 18:26:20

标签: xpath scrapy substring

我有以下HTML源模式:

<ul class="test_ul">
     <li>
         <img src="https://www.awebsite.com/image_1_a_test.png" />
    </li>  
    <li>
         <img src="https://www.awebsite.com/another_1_b_test.jpg" />
    </li>
</ul>

现在我希望能够只选择src指向包含&#34; b_test&#34;的图像的路径。串。

这就是scapy中选择器的字符串:

".//ul[@class='test_ul']//img[contains(@src,'b_test')]"

但这似乎不起作用,我也没有看到错误。我能够找到全名,但不能查询子串。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

我认为您应该包含/@src以获取网址路径

".//ul[@class='test_ul']//img[contains(@src,'b_test')]/@src"