PDF抓取,整理抓取的数据

时间:2019-10-16 17:06:09

标签: csv tabula pdf-scraping

我每天花费大量时间进行数据输入,因为我们的Commercehub没有链接到我们的Shipstation帐户,显然它们之间没有第三方兼容,例如eBridge或Logicbroker。

但是,将运输信息和发票号输入回commercehub并不是问题,傻瓜将每个订单手动输入到UPS worldship中的时间。

我以前刮过html,但没有刮过pdf,我在这里尝试过Tabulizer:https://github.com/ropensci/tabulizer。但是我需要每一页的数据都在一行中。附件如下:样本pdf和我的结果。 pdf-scraping sample

我需要这个(船厂提供的样品):

https://docs.google.com/spreadsheets/d/1DAqVgNoEjmHboKU2_jLSld90snxIAK-PSKpC1hBKCeE/edit?usp=sharing

如何调整编码以这种方式拉动它?

0 个答案:

没有答案