如何正确存储BeautifulSoup对象以供以后使用

时间:2018-09-11 12:41:43

标签: python python-3.x web-scraping beautifulsoup

最近,我一直在尝试存储某些页面的源代码,以便以后可以从它们中删除我需要的内容,而不必担心Internet或可能的防刮擦措施。我的第一种方法是将每个链接的bs.prettify对象保存到同一DataFrame的列中。过了一会儿,我意识到我无法在那些对象上导航解析树(例如,访问bs.h1)。因此,我想知道是否有一种方法可以将字符串从bs.prettify对象转换为可导航的BeautifulSoup对象,或者是否有比将数据源代码存储到DataFrame中供以后使用更好的方法?

0 个答案:

没有答案