我正在使用scrapy
,这是一个用于网页抓取的python框架,用于从网站中提取信息。
我想从中提取信息的网站是:http://apps.who.int/classifications/icd10/browse/2016/en
从网站左侧的索引树中,我想要提取L ##代码以及L ##。#代码及其名称(其中L代表字母和#数字)。所以我想要的前两个提取是:
<00> A00霍乱 <00> A00.0霍乱暴露于霍乱弧菌01,生物变种霍乱
问题是,当我打开scrapy shell并运行时:
fetch('http://apps.who.int/classifications/icd10/browse/2016/en')
view(response)
响应似乎不包括我想要的索引。
为什么scrapy不能获得这个索引,有没有办法解决它?
答案 0 :(得分:0)
如果您{ur了} {{0}},则无法找到您要查找的文字或元素。可能它们是由javascript加载生成的。 所以你必须查看正在执行它的javascript代码。