Question

我编写了从pdf中提取文本的代码，它运行正常。问题是，即使我在不同的页面上，也只会提取第一页的文本。

以下是我正在使用的代码 -

public void extracttext()
{
TextWord[][] textWord = core.textLines(mDocView.getDisplayedViewIndex());
 int z, j;

for (z = 0; z < textWord.length; z++) {
    for (j = 0; j < textWord[z].length; j++) {
        word = word + textWord[z][j].w + " ";
    }
  }
}

我犯了什么错误？

Answer 1

嗯，我犯了一个非常愚蠢的错误。我忘了将单词重新初始化为“”。因此，提取的文本是在已经提取的文本之后添加的，我曾经认为文本只是从第一页提取的。

从pdf中提取当前页面的文本（使用MuPDF）

1 个答案: