我正在编写一个编辑PDF的C#程序。我正在寻找PDF字段名称列表。 根据我的理解,PDF有文档块的字段名称(如页脚,标题等)。我可能在这方面做错了,但我已经读了很多,这表明了这一点。
我似乎无法找到标准字段名称列表。我想知道是否有人可以指导我。或者,至少,为我提供PDF页脚的字段名称。
如果我对这一切都错了,请告诉我,如果可以,请提供一个链接,以便更好地了解使用C#编辑PDF。
由于
答案 0 :(得分:1)
据我所知,PDF有大量的字段名称 文件(如页脚,标题等)。
这是完全错误的。
我似乎无法找到标准字段名称列表。
没有这样的清单。有两种类型的交互式表单:AcroForm技术和XML Forms Architecture。
为我提供了一个链接,以便更好地了解使用C#编辑PDF。
请阅读chapter 6 of my book的介绍。 PDF 不是文档编辑格式。
我的假设:您将标记PDF与交互式表单混淆。当你谈论领域时,每个人都会想到一个表格。从你的问题的背景来看,我认为你在谈论Tagged PDF。
大多数PDF都不了解结构。您可以创建一个PDF,其内容可以用肉眼解释为表格,但是当计算机程序查看此表格时,它只会看到单词和句子的行和部分。 PDF仅关注呈现数据,而不关心数据的结构。这是默认值。
在某些标准(例如PDF / UA和PDF / A Level A)的上下文中,您可以引入结构。结果是标记PDF。在该结构中,存在用于该结构的预定义元素集,使得解析文档的计算机程序可以识别标题,段落,表行,表格单元等。这些元素在ISO-32000-1中描述。
页眉和页脚不是此结构的一部分。它们是定义的工件,因为它们不是真实内容的一部分。例如:小说的PDF / UA文件可以大声朗读,并且您不希望读取正在运行的标题,因为它不是故事的一部分。
请注意,这些结构元素的名称也可以自由选择,但它们始终映射到其中一个标准名称(使用RoleMap条目)。
我不了解您问题的背景,但您应该真正阅读并理解ISO-32000-1,以全面了解您尝试实现的目标。现在,听起来好像你正试图做一些不可能的事情。
答案 1 :(得分:0)
字段名称是表单字段的标识符,例如文本字段和复选框。我怀疑你把字段与PDF标签混淆了。这些标记布局元素,如标题,页脚等。
在这里你可以找到他们的名字: http://help.adobe.com/en_US/acrobat/X/pro/using/WS58a04a822e3e50102bd615109794195ff-7cd8.w.html