在stackoverflow上或在Google搜索之后,我还没有看到此问题的任何答案。
我需要使用哪些R软件包将PDF读入R,其中包含手写签名和已填写的盒子?
我有大量的PDF数据集,这些数据几乎都是要求标准东西的调查。名称,电话号码,家庭住址,签名...这些PDF看起来像很好的例子是《大众健康应用程序》 https://www.mass.gov/files/2017-08/app.pdf。
1)是否有R的程序包可以读取带有签名或框填充的PDF?
2)我是否必须将这些PDF保存为其他格式,例如jpeg?
答案 0 :(得分:0)
除非您要处理大量具有相同笔迹的文档,否则OCR技术的先进程度不足以将签名转换为机器可读的字符。还没有计算机视觉。最好的选择是雇用一家公司来手动转录大量信息。