我有一个HTML表,该表具有7列和3行(行数可能更多或更少)。第二列包含指向PDF文件的链接,第七列包含短语“纠正措施”,我只想从包含单词“ Corrective Action”的列中下载PDF文件。但是,我的代码仅下载第一个PDF。
这是代码: http://dev.atriumfinehomes.com/clonewebtable/sample.PNG
这是表: http://dev.atriumfinehomes.com/clonewebtable/table.htm
请给我一些帮助吗?
答案 0 :(得分:1)
使用“提取表”命令获取PDF文件的链接。
获取链接的步骤:
-编辑提取表命令->高级视图->步骤6:将选定标签的详细信息提取到CSV文件。标签名称:超链接,属性名称:获取URL。
-将数据保存到另一个CSV文件。 (您不能将其保存在将追加或覆盖的文件中)。
-打开CSV文件作为电子表格。
在循环之内
-创建新变量 $ vCounter $ ,因为links.csv文件不会将表头作为表头。
-使用变量操作将 $ Counter $ -1 分配给 $ vCounter $ 。
-使用“获取单元格”命令并获取单元格 A $ vCounter $ ,并将其分配给新变量 $ vPDFURL $ 。
-在下载命令中使用 $ vPDFURL $ 作为下载文件URL。
答案 1 :(得分:0)
这是因为您仅下载了“ correctiveaction1.pdf”,但第3行中的PDF被命名为“ correctiveaction3.pdf”