C#的可编辑字段名称

时间:2014-05-23 14:53:50

标签: c# pdf

我正在编写一个编辑PDF的C#程序。我正在寻找PDF字段名称列表。 根据我的理解,PDF有文档块的字段名称(如页脚,标题等)。我可能在这方面做错了,但我已经读了很多,这表明了这一点。

我似乎无法找到标准字段名称列表。我想知道是否有人可以指导我。或者,至少,为我提供PDF页脚的字段名称。

如果我对这一切都错了,请告诉我,如果可以,请提供一个链接,以便更好地了解使用C#编辑PDF。

由于

2 个答案:

答案 0 :(得分:1)

  

据我所知,PDF有大量的字段名称   文件(如页脚,标题等)。

这是完全错误的。

  

我似乎无法找到标准字段名称列表。

没有这样的清单。有两种类型的交互式表单:AcroForm技术和XML Forms Architecture。

  • 使用AcroForm技术时,字段使用PDF字典定义并表示为窗口小部件注释。创建表单的人可以选择字段的名称:" customer"," address"," country",...
  • 使用XFA时,使用XML描述表单,您可以使用任何XSD创建字段(您可以选择自己的标记/字段名称)。
  

为我提供了一个链接,以便更好地了解使用C#编辑PDF。

请阅读chapter 6 of my book的介绍。 PDF 是文档编辑格式。

我的假设:您将标记PDF与交互式表单混淆。当你谈论领域时,每个人都会想到一个表格。从你的问题的背景来看,我认为你在谈论Tagged PDF。

大多数PDF都不了解结构。您可以创建一个PDF,其内容可以用肉眼解释为表格,但是当计算机程序查看此表格时,它只会看到单词和句子的行和部分。 PDF仅关注呈现数据,而不关心数据的结构。这是默认值。

在某些标准(例如PDF / UA和PDF / A Level A)的上下文中,您可以引入结构。结果是标记PDF。在该结构中,存在用于该结构的预定义元素集,使得解析文档的计算机程序可以识别标题,段落,表行,表格单元等。这些元素在ISO-32000-1中描述。

页眉和页脚不是此结构的一部分。它们是定义的工件,因为它们不是真实内容的一部分。例如:小说的PDF / UA文件可以大声朗读,并且您不希望读取正在运行的标题,因为它不是故事的一部分。

请注意,这些结构元素的名称也可以自由选择,但它们始终映射到其中一个标准名称(使用RoleMap条目)。

我不了解您问题的背景,但您应该真正阅读并理解ISO-32000-1,以全面了解您尝试实现的目标。现在,听起来好像你正试图做一些不可能的事情。

答案 1 :(得分:0)

字段名称是表单字段的标识符,例如文本字段和复选框。我怀疑你把字段与PDF标签混淆了。这些标记布局元素,如标题,页脚等。

在这里你可以找到他们的名字: http://help.adobe.com/en_US/acrobat/X/pro/using/WS58a04a822e3e50102bd615109794195ff-7cd8.w.html