网页抓取python <span class =“ b6a29bc0” aria-label =“ Beds”> 2 </span>,<span class =“ b6a29bc0” aria-label =“ Baths”> 2 </span>

时间:2019-11-20 07:06:12

标签: python css web-scraping web-crawler

我必须在html代码下面提取文本内容以进行python Web抓取,问题是类参数所有三个具有相同类参数的变量,因此我尝试了不起作用的arial-label。

2

3

Property_beds = response.css('。b6a29bc0 :: text')。extract()

结果  得到两个变量“床”,“浴室”,我只想要单个变量浴室

“属性床”:[2,3]

但是我想在response.css()中包含aria-label =“ Baths”,我尝试使用下面的代码,但是输出列表为空

Property_beds = response.css('span.b6a29bc0aria-label [attribute =“ Beds”] :: text')。extract()

enter image description here

enter image description here

1 个答案:

答案 0 :(得分:1)

单身

Property_beds = response.css('span.b6a29bc0[aria-label=Beds]::text').extract()

对于多个节点,请使用css或语法:

response.css('span.b6a29bc0[aria-label=Beds], span.b6a29bc0[aria-label=Studio]').getall()