如何从PDF中提取用户输入的字段?

时间:2009-06-15 17:07:52

标签: pdf csv

我有一个可以保存的PDF文件,其中包含一些用户将填写的字段。从那里我想通过将用户输入的字段解压缩到CVS文件来批处理这些文件。

由于我是一名.NET员工,我已经看过PDFBox和iTextSharp。使用PDFBox,我能够提取表单的文本,但不能提取用户在字段中输入的字段。尽管我可能错了,但这似乎并不是那么简单。

有没有更快的方法来完成任何其他语言?我听说过Adobe SDK,接下来会研究,但到目前为止我对此一无所知。或者有人知道如何完成我在前面提到的库中做的事情吗?

更新:没有人知道任何开源或免费图书馆?我这样做更像是一个概念证明,并且没有一些人可以解决这个问题。

4 个答案:

答案 0 :(得分:1)

尝试Apago的PDFspy,http://www.apagoinc.com/pdfspy

答案 1 :(得分:1)

我强烈推荐Tall Components PDF产品。我已经使用TallPDF.NET组件动态生成PDF。高大的组件PDFKit.Net可能会做你需要的一切。我没有使用过它们的特定产品,但是如果它类似于他们的TallPDF组件,那么它将是非常好的。它虽然相当昂贵......许可证的价格大约在700美元左右。但他们确实有一个评估下载供你试用。

答案 2 :(得分:0)

虽然我没有使用ASPOSE的这个特定产品,但ASPOSE.Pdf.Kit组件将提取字段名称和字段数据。

来自literature

“您还可以将PDF文档的所有表单字段(包括其名称和值)读取为XML,FDF(表单数据格式)和XFDF文件。”

答案 3 :(得分:0)

当我查看这个(几年前)时,你必须使用Acrobat Professional而不是Acrobat Reader来填写以后可以回读的表格。我永远不明白为什么你不能用Acrobat Reader做到这一点。