阅读带有文本,手写签名和框填充的PDF

时间:2018-09-12 20:51:27

标签: r pdf tensorflow jpeg

在stackoverflow上或在Google搜索之后,我还没有看到此问题的任何答案。

我需要使用哪些R软件包将PDF读入R,其中包含手写签名和已填写的盒子?

我有大量的PDF数据集,这些数据几乎都是要求标准东西的调查。名称,电话号码,家庭住址,签名...这些PDF看起来像很好的例子是《大众健康应用程序》 https://www.mass.gov/files/2017-08/app.pdf

1)是否有R的程序包可以读取带有签名或框填充的PDF?

2)我是否必须将这些PDF保存为其他格式,例如jpeg?

1 个答案:

答案 0 :(得分:0)

除非您要处理大量具有相同笔迹的文档,否则OCR技术的先进程度不足以将签名转换为机器可读的字符。还没有计算机视觉。最好的选择是雇用一家公司来手动转录大量信息。