使用Beautifulsoup进行Web Scraping并从单个词典中返回json转储?

时间:2017-08-19 14:06:56

标签: python json dictionary

我的Pc中有很多HTML文件,我需要从它们中抓取一些嵌套在表格中的数据,然后从不同表格中删除的信息中创建一个统一的json.dump我已设法刮掉表格为了和创建了一个字典,其中包含一个列表,其中包含每个表中的信息,然后我使用以下方法将我想要的信息放到第二个字典中,该方法基本上在函数内重复了3次

@args

我面临的两个问题:

  1. 如何统一包含3个词典的3个词典 我想要的最终数据?请注意,最终的json.dump必须有一个 根据它们所包含的元素的具体顺序 它
  2. 表中的部分数据是例如百分比 '\ n'-0,58%'\ n'当我刮掉它们时,我已经设法移除了 带有.strip的“白噪声”,但似乎在我无法转换之后 他们为任何想法编号吗?

0 个答案:

没有答案