我有一个PDF文件,试图将其解析出来。我使用Microsoft Word打开了文件,标题中是我需要的文本。在第一页上,标题的左边是一个中心选项卡,该选项卡包含我要抓住的文本(纯英文名称文档标题,而不是复杂的参考名称)。右边的选项卡具有我不关心的页码控件。
当我尝试运行以下命令时:
Debug.Print ThisDocument.Sections(1).Headers(wdHeaderFooterPrimary).Exists
它给了我True
,所以我知道标题存在。但是,当我尝试运行
Debug.Print ThisDocument.Sections(1).Headers(wdHeaderFooterPrimary).Range.Text
除了空字符串外,它什么也没有给我,我可以通过将其包装在Len(…)
命令中来进一步确认。如何从标题中提取文本?
值得注意的是,我尝试使用某些Adobe SDK功能,这些功能本来会更简单,但是我没有专业的Acrobat套件,因此无法访问这些工具。因此,MS Word解决方法。