应用错误收集

最近，我一直在尝试存储某些页面的源代码，以便以后可以从它们中删除我需要的内容，而不必担心Internet或可能的防刮擦措施。我的第一种方法是将每个链接的bs.prettify对象保存到同一DataFrame的列中。过了一会儿，我意识到我无法在那些对象上导航解析树（例如，访问bs.h1）。因此，我想知道是否有一种方法可以将字符串从bs.prettify对象转换为可导航的BeautifulSoup对象，或者是否有比将数据源代码存储到DataFrame中供以后使用更好的方法？

如何正确存储BeautifulSoup对象以供以后使用

0 个答案: