如何从UIPath的子页面中抓取数据

时间:2018-11-25 08:03:48

标签: web-scraping rpa uipath

我正在使用UIPath数据抓取功能,并且可以很好地进行多页传输。 但是,我的要求是使用UIPath获取子页面数据。

例如我的第一页包含所有产品列表,当我单击每个产品时,将获得产品的完整详细信息,并且需要使用UIPath进行剪贴。

我已参考以下链接,但未找到解决方案, https://forum.uipath.com/t/how-to-scrap-multiple-pages-data-from-a-site/7014/6

3 个答案:

答案 0 :(得分:1)

签出queues and transactions。我建议使用两种工作流程:一种只是解析分页结果,将详细页面的URL存储在队列中。然后,如果需要,最多n个机器人可以并行处理队列,打开详细信息页面并抓取所需数据。

答案 1 :(得分:0)

请尝试以下步骤,有关更多详细信息,请访问下面的链接WEB DATA SCRAPING,以更好地理解。 以下是示例
1.打开Internet Explorer并导航到亚马逊。
2.在搜索框中,键入“排球”,然后按Enter。结果显示在网页中。
3.在Studio中的“设计”选项卡上,在“向导”组中,单击“数据收集”。显示提取向导。
4.在向导之后,选择网页中的第一项和最后一项。将显示“配置列”向导步骤。
5.选中提取URL复选框。
6.更改列标题的名称。
7.单击下一步。将显示数据预览,并在Web浏览器中突出显示您选择的字段。
8单击“提取相关数据”按钮。提取向导再次启动。
9.再次按照向导指示项目价格。您进入“配置列”步骤。
10.更改新列的名称,然后单击“下一步”。显示数据预览。
11.(可选)通过将其拖动到位来更改列的顺序。
12.单击完成。如果跨度超过一页,则会显示“指示下一个链接”窗口,提示您指示“下一个”按钮。
13.单击是,然后在Amazon中选择“下一页”按钮。项目将保存并显示在“设计器”面板中。请注意,数据表变量ExtractDataTable已自动生成。
14.将Excel Application Scope活动拖动到Data Scraping容器下。
15.在“属性”面板的“ WorkbookPath”字段中,键入要将数据写入其中的现有Excel文件的文件路径。
16.在“变量”面板中,将自动生成的数据表变量的范围更改为“序列”。
17.在Excel Application Scope中,拖动“写入范围”活动。
18.在“属性”面板的“数据表”字段中,添加ExtractDataTable变量。
19.按F5。自动执行。
20.打开在步骤15中使用的Excel文件。请注意,所有列均已正确填充。

答案 2 :(得分:-1)

您将不得不在UIPath中自己编写代码。

您可以使用数据抓取向导来抓取父页面,然后在数据表中循环浏览,依次转到每个链接并抓取子页面,然后将数据添加到数据表中(或执行任何操作) )。