我正在开发一个需要处理填写的PDF表单的网络应用程序(在这种情况下,转换为网络表单不是一种选择,因为我正在处理数字签名的PDF)。
应用程序需要上传PDF,将表单数据从PDF解析为JSON,然后将PDF作为附件上传到CouchDB服务器。
第1部分和第3部分很简单,但我无法找到在浏览器中提取PDF数据的方法。
在我看来,我有三个选择:
实现或查找Web服务(可能是使用pdf2json之类的节点服务)。通过AJAX发送PDF,获取格式化的JSON数据。我宁愿不这样做,因为它需要额外的"网络服务电话,但如果我需要,可以。
找一个可以在浏览器中处理PDF解析的库(来自blob / base64编码的数据),并使用它来实现。
使用browserify或类似方法将node.js模块(如pdf2json)转换为浏览器中可用的内容。
有没有人在浏览器中实现PDF表单解析?或者我是否需要实施Web服务?