没有工作parcing scrapy

时间:2015-12-28 10:38:55

标签: python scrapy

它不会从标题中收集数据。我在样本中做了,但它仍然拒绝工作。这是我的代码:

toster.py:

#ifndef __MYHEADER_H
  #define __MYHEADER_H

#ifdef __cplusplus
  extern "C"{
#endif
  void dchar(unsigned char);
  void char*(char c);

#ifdef __cplusplus
  }
#endif
#endif

任何帮助?

1 个答案:

答案 0 :(得分:0)

代码中存在多个问题:

  • Content-Type
  • 中删除www.
  • 在链接提取器中修复正则表达式 - 将allowed_domains替换为\d
  • 设置\d+让Scrapy处理分页页
  • unique=False中修复您的提取逻辑 - 例如,这些页面上没有parse_item()类的元素

修正版(适合我):

thing