在scrapy python中使用非类标签选择

时间:2018-11-10 15:58:47

标签: python xpath scrapy

我正在尝试删除网站的标题,但是它没有类和ID的问题。

通常,我使用它来获得具有类的标题:

void main() {
  String s = "Hello, world! i am 'foo'";
  print(s.replaceAll(new RegExp(r'[^\w\s]+'),''));
}

现在我正在尝试提取文本,请查看屏幕截图,您能解决它吗? [https://i.stack.imgur.com/k6aCN.png][1]

1 个答案:

答案 0 :(得分:0)

您可以通过任何属性(不仅是类和id)或其与其他元素的相对位置来定位特定节点。

有关屏幕快照中文本的一些示例:

response.xpath('//div[@class="job-title-text"]/a/text()')
response.xpath('//a[contains(@onclick,"clickJObTitle")]/text()')
response.xpath('//a[contains(@href,"jobdetails")]/text()')
response.css('div.job-title-text a::text')
response.css('a[onclick*=clickJObTitle]::text')
response.css('a[href*=jobdetails]::text')

另请参阅: