Question

我正在尝试删除网站的标题，但是它没有类和ID的问题。

通常，我使用它来获得具有类的标题：

void main() {
  String s = "Hello, world! i am 'foo'";
  print(s.replaceAll(new RegExp(r'[^\w\s]+'),''));
}

现在我正在尝试提取文本，请查看屏幕截图，您能解决它吗？ [https://i.stack.imgur.com/k6aCN.png][1]

Answer 1

您可以通过任何属性（不仅是类和id）或其与其他元素的相对位置来定位特定节点。

有关屏幕快照中文本的一些示例：

response.xpath('//div[@class="job-title-text"]/a/text()')
response.xpath('//a[contains(@onclick,"clickJObTitle")]/text()')
response.xpath('//a[contains(@href,"jobdetails")]/text()')
response.css('div.job-title-text a::text')
response.css('a[onclick*=clickJObTitle]::text')
response.css('a[href*=jobdetails]::text')

另请参阅：

在scrapy python中使用非类标签选择

1 个答案: