用于电子表格的Google脚本,用于从工作表上链接的PDF页面中提取数据

时间:2014-11-21 15:56:25

标签: excel-vba google-apps-script vba excel

我在谷歌或Excel电子表格的不同行中上传了一系列PDF文件(也存储在我的计算机上)。每行都有一个链接到它的不同PDF文件。我想弄清楚的是从PDF中提取5行数据(而不是表格)并将其添加到工作表上的某些列的方法:

这是一个示例pdf: https://www.dropbox.com/s/2j7pqeja38jxmzc/Sample.pdf?dl=0

表格如下: https://www.dropbox.com/s/40u1n7umacd74kw/Sample%20sheet.xlsx?dl=0

因此,该过程将类似于第1行中的Excel打开链接文件,提取所需数据,然后将数据添加到Excel / Google电子表格中的某些列。

我只是想知道这是否可行.. PDF有很多页面,但我只需要来自其中一页的数据。

如果这不适用于Excel / Google电子表格,有什么建议我可以自动执行此过程吗?

PS:我没有要求确切的方法,因为我知道这是违规,只是想知道这是否可能,可以在Excel或Google电子表格中完成。如果没有,任何建议都会有很大帮助。谢谢!

1 个答案:

答案 0 :(得分:0)

是的,这是可能的,但这在很大程度上取决于PDF,我认为这将是最大的障碍。您可能会发现this answer至少是相关的,如果不是您正在寻找的内容。

否则,如果所有内容都存储在云端硬盘中,那只是一个问题:

1)循环播放工作表并打开所需的文档。 2)获取PDF的内容(可能是一个字符串)。 3)找到一种从PDF中删除相关数据的一致方法(这在很大程度上取决于PDF的内容)。 4)将数据粘贴到工作表。

3号可能是你最大的挑战,但一旦你开始使用,你可能会发现它比你想象的容易得多。