应用错误收集

解析大型缓存的html（LXML）

时间：2018-09-11 09:16:44

标签： python html parsing lxml

我想知道是否有可能解析存储在缓存中的大型html文件。在使用Beautiful Soup（用于大型html检索）时，我遇到了一些问题，因此现在尝试使用lxml进行迭代解析。

我正在使用获取HTML代码的请求，因此我希望将其集成到此工作流程中。我想我可以将html代码保存到文件中，然后使用iterparse解析文件，但我宁愿不保存任何文件（即使是临时文件）。

0 个答案:

没有答案