Xpath错误消息" exceptions.ValueError:无效的XPath:"

时间:2015-07-11 05:47:34

标签: xpath scrapy-spider

我尝试使用xpath获取以下html代码的@content属性:

int storage::experience[10] = { 100, 200, 400, 600, 1000, 2500, 3000, 4000, 5000, 10000 };

我使用这个xpath代码作为scrapy spider的一部分:

<meta content="52222" name="DCSext.job_id">

我收到了带下划线的代码的错误消息:

    def parse(self, response):
    hxs = HtmlXPathSelector(response)
    sites = hxs.select('//*')    

    for site in sites:
        il = DataItemLoader(response=response, selector=site)
        il.add_xpath('listing_id', 'meta[@name="DCSext.job_id"]@content')
        ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
        il.add_xpath('loc_pj', substring-after('h1[@class="title heading"]/text()',':'))
        il.add_xpath('title', 'head/title/text()')
        il.add_xpath('post_date', 'div[@id="extr"]/div/dl/dd[3]/text()')
        il.add_xpath('web_url', 'head/link[@rel="canon"]@href')
        yield il.load_item()    

如何解决这个问题?非常感谢!

1 个答案:

答案 0 :(得分:1)

正确的代码应该是:

meta[@name="DCSext.job_id"]/@content
                           ^