如何从html网站中将多个表(35-40个表)提取到一个Excel文件中?

时间:2019-11-28 15:49:27

标签: datatable rpa uipath

当前,我正在尝试从以下页面检索数据:https://www.hdb.gov.sg/cs/infoweb/residential/renting-a-flat/renting-from-the-open-market/rental-statistics,如您所见,一年中有四个季度,每个季度都有一个不同的表。我希望提取表,但是目前,我无法自动执行该过程,只能执行一次。最重要的是,我希望在检索到的数据表中添加两列,分别是“季度”和“年份”。有什么建议么?附上的照片是我的工作流程和我的精益求精。 Workflow part 1 Workflow part 2 Workflow part 3 Result

1 个答案:

答案 0 :(得分:2)

获取年数/循环年数(或从第一年开始直到最后一年)。 每年尝试通过数据抓取来获取数据(元素存在,只是隐藏/未扩展;对数据进行一次表数据抓取以进行数据建模,然后在循环内重复使用)。对于数据抓取,您需要更改选择器,以通过使用年份和季度来使其适用于所有表(只是一个通用示例,例如*年*季度*)。所有表的列均相同。

  • 我没有在网站菜单或页面中看到详细信息,很好地检查是否允许机器人抓取数据

  • 以上将是最快的方法。 FindChidren活动更加复杂。