我刚刚开始使用iText7来读取某些PDF文件,这些文件的格式相同但文本不同,但是我在读取特定部分时遇到了麻烦。
我编写了一个简单的代码来阅读文本:
PdfReader reader = new PdfReader("tasrit.pdf");
PdfDocument doc = new PdfDocument(reader);
var page = doc.GetPage(1);
MessageBox.Show(PdfTextExtractor.GetTextFromPage(page));
那很好。但是,我需要提取PDF页面的某些部分。这是我的页面,每次看起来都一样(框中的文本在每个页面中都会有所不同,但表的布局是相同的):
我只需要提取框中的文本,而无需所有页眉和页脚,但是我还没有找到使用iText7的示例。