解析大型缓存的html(LXML)

时间:2018-09-11 09:16:44

标签: python html parsing lxml

我想知道是否有可能解析存储在缓存中的大型html文件。在使用Beautiful Soup(用于大型html检索)时,我遇到了一些问题,因此现在尝试使用lxml进行迭代解析。

我正在使用获取HTML代码的请求,因此我希望将其集成到此工作流程中。 我想我可以将html代码保存到文件中,然后使用iterparse解析文件,但我宁愿不保存任何文件(即使是临时文件)。

0 个答案:

没有答案