Scrapy返回错误的字体

时间:2015-06-02 21:47:32

标签: python web-scraping scrapy

我正在使用scrapy来收集一些数据,当我尝试从craiglist中抓取tag元素时,它会返回与其他元素不同的字体。如何让左栏中的字体看起来像右边的字体? 这是我正在使用的图片和代码:

  item["tag"] = " ".join(response.xpath("//p[@class='attrgroup']/span/b/text()").extract()[0])

How can i make font in the left column look like font in the right one?

2 个答案:

答案 0 :(得分:0)

请尝试使用response.xpath("string(//p[@class='attrgroup'])")

答案 1 :(得分:0)

似乎每个字母之间都有一个空格:

apunch@dlsyd00012:~/code/analytics/src$ echo -n '2 0 1 3 D o d g e o d o m e t e r : 4 7 0 0 0'|hexdump -C
00000000  32 20 30 20 31 20 33 20  44 20 6f 20 64 20 67 20  |2 0 1 3 D o d g |
00000010  65 20 6f 20 64 20 6f 20  6d 20 65 20 74 20 65 20  |e o d o m e t e |
00000020  72 20 3a 20 34 20 37 20  30 20 30 20 30           |r : 4 7 0 0 0|

您可以使用以下内容提取每一个字符,但似乎存在更深层次的问题:

response[0::2]

您可以发布您正在使用的确切网页的网址吗?