Question

我正在使用scrapy来收集一些数据，当我尝试从craiglist中抓取tag元素时，它会返回与其他元素不同的字体。如何让左栏中的字体看起来像右边的字体？这是我正在使用的图片和代码：

  item["tag"] = " ".join(response.xpath("//p[@class='attrgroup']/span/b/text()").extract()[0])

How can i make font in the left column look like font in the right one?

Answer 1

请尝试使用response.xpath("string(//p[@class='attrgroup'])")。

Answer 2

似乎每个字母之间都有一个空格：

apunch@dlsyd00012:~/code/analytics/src$ echo -n '2 0 1 3 D o d g e o d o m e t e r : 4 7 0 0 0'|hexdump -C
00000000  32 20 30 20 31 20 33 20  44 20 6f 20 64 20 67 20  |2 0 1 3 D o d g |
00000010  65 20 6f 20 64 20 6f 20  6d 20 65 20 74 20 65 20  |e o d o m e t e |
00000020  72 20 3a 20 34 20 37 20  30 20 30 20 30           |r : 4 7 0 0 0|

您可以使用以下内容提取每一个字符，但似乎存在更深层次的问题：

response[0::2]

您可以发布您正在使用的确切网页的网址吗？

Scrapy返回错误的字体

2 个答案: