有没有一种方法可以将PDF中的数据抓取为结构化JSON格式?

时间:2019-11-19 04:14:43

标签: python r json pdf uipath

我正在尝试从PDF中提取数据。要以结构化方式提取的数据。例如,文档ID及其对应的值。我们必须提取一组键值对作为json格式并存储在db中。有没有办法完成这项任务?

1 个答案:

答案 0 :(得分:2)

如果您使用的是UIPath,则需要安装2个软件包:

1.Uipath PDF活动-阅读pdf

2.UiPath Web活动-在这里您可以找到DeserializeJSON活动(或DeserializeJSON数组)

***我个人将提取数据并将其保存在xlsx文件中