可填写的PDF到HTML

时间:2014-07-07 18:10:29

标签: javascript vb.net parsing pdf

有没有办法创建简单的可填写embed PDF文件,允许我通过JS或ASP提取文本?

现在我知道有一些像iTextSharppdf2html等库,但我发现这些只是过于复杂或不足以满足我的需求。

场景是这样的,我试图embed客户可能填写的税务文件,在保存文档后,然后将字段提取到对象中。截至目前,我已将PDF转换为SVG inkscape,但这仍然感觉有些臃肿。

我只想迭代每个字段并相应地存储它。

以下是其中一个文件的示例:

http://www.cra-arc.gc.ca/E/pbg/tf/t4/t4flat-fill-13b.pdf

1 个答案:

答案 0 :(得分:2)

其中一种方法是使用FDFXFDF提交。

基本上,浏览器显示PDF,用户填写PDF并单击提交按钮。 PDF查看器将有关填充字段的信息发送到指定的URL。

您可以在创建PDF时选择提交格式。

以下内容来自XML Forms Data Format Specification

  

FDF是PDF的简化版本。 PDF和FDF代表信息   具有键/值对,也称为条目。这个例子   显示带有括在括号中的值的T和V键:

/T(Street)/V(345 Park Ave.) 
     另一方面,XFDF表示带有XML的条目   元素/内容或属性/值对,如对应所示   XFDF:

<field name="Street"> 
    <value>345 Park Ave.</value> 
</field>

请确保并非所有PDF查看者都可以提交表单数据。