是否有任何工具可用于获取PDF文件的内部结构(基于XML)?

时间:2012-01-09 10:12:40

标签: c# pdf c#-4.0 pdf-generation acrobat

我们已经在MS-WORD 2007中使用C#4.0(WIN FORM应用程序),使用MS-WORD 2007的开放XML表示来分割,聚合word文档。现在,我们将工作扩展到支持PDF文件那么,我想知道是否有任何工具可用于获取PDF文件的内部结构(基于XML)同样为MS-OFFICE 2007开放XML表示?

请赐教我这个......?

1 个答案:

答案 0 :(得分:0)

PDF是否包含任何标记内容?否则,您无法提取XML结构