这是我要提取的ID
\"ctl00_ctl69_g_6ffada3a_2cbc_43a0_9034_f48a864a8873_grdViewUnit\"
我在python(scrapy)中试过这个xpath
table = sel.xpath(".//table[@id='\"ctl00_ctl69_g_6ffada3a_2cbc_43a0_9034_f48a864a8873_grdViewUnit\"']//tr")
绝对错误,如何为这些引号和斜线和反斜杠做正确的插入
如果你能给我一个官方网站,请欣赏它
答案之后我的代码是:
table = sel.xpath(".//table[contains(@id, 'grdViewUnit')]//tr")
for one in table:
Region = one.xpath('./td[1]/text()').extract()[0]
Area=one.xpath('./td[2]/text()').extract()[0]
Description=one.xpath('./td[3]/text()').extract()[0]
TotalWorth=one.xpath('./td[3]/text()').extract()[0]
print(Region+Area+Description+TotalWorth)
但它不起作用,我不知道我的代码或我的xpath是错误的
答案 0 :(得分:1)
逃避反斜杠:
//table[@id = '\\"ctl00_ctl69_g_6ffada3a_2cbc_43a0_9034_f48a864a8873_grdViewUnit\\"']//tr
或者,您可以使用部分匹配:
//table[contains(@id, 'ctl00_ctl69_g_6ffada3a_2cbc_43a0_9034_f48a864a8873_grdViewUnit')]//tr