随时随地从自动化网页中提取表格

时间:2018-08-30 13:08:49

标签: web-scraping rpa automationanywhere

使用Web记录器执行某些步骤后,是否可以从Automation Anywhere的网页中提取表。该表不会直接显示,而是在启动URL后单击一些控件后显示的。 登录到网站并使用搜索条件控件进行过滤后,我要提取的表就会出现。

我使用Web记录器登录并在文本字段中输入了所需的搜索条件,现在我想提取表格。当我使用Web记录器时,它将再次启动URL,并带我回到我不需要的登录页面。我希望漫游器停留在页面上。请帮助。

此外,提取表的会话名称的意义是什么?

3 个答案:

答案 0 :(得分:1)

如果单击“高级视图”,您将在步骤5中找到:使用现有的IE窗口运行此命令。尝试用表格而不是登录页面之一写页面的URL。

提取的表将通过变量$ Table Column(Index)$使用,其中index为列号或列名

答案 1 :(得分:0)

您可以使用对象克隆直接导出,并在选择条件中导出到csv文件。但是我们也需要在搜索条件中单击html内部文本

答案 2 :(得分:0)

一个老问题,但是我的经验是,Extract Data / Table命令相当差。它们不仅只能在IE中工作,您不能将它们作为命令来调用,还必须通过网络记录来调用它们。

相反,我发现对象克隆初始元素,获取DOMXPath并对其进行可变化更为有用。然后将其放入while循环中,并设置查找至少一个元素(要尝试构建的表的元素)的条件。您可以在对象克隆命令中获取各种有用的信息,然后将其移到变量/表中。

例如

//div[@id='updatable-standings']/div[1]/div[1]/div[2]/div[1]/table[1]/tbody[1]/tr[3]/td[2]/div[1]/span[2]
//div[@id='updatable-standings']/div[1]/div[1]/div[2]/div[1]/table[1]/tbody[1]/tr[4]/td[2]/div[1]/span[2]

我可以为{tr [3]}创建一个增量变量,并将其命名为$ vTeamLoop $,并将对象克隆中的DOMXPath值更改为

//div[@id='updatable-standings']/div[1]/div[1]/div[2]/div[1]/table[1]/tbody[1]/tr[$vTeamLoop$]/td[2]/div[1]/span[2]

最终,它比“数据/表提取”命令所执行的步骤更多,但是作用域上的限制要小得多。

希望有帮助。

enter code here