从pdf中提取当前页面的文本(使用MuPDF)

时间:2015-10-28 12:11:43

标签: android text-extraction mupdf current-page

我编写了从pdf中提取文本的代码,它运行正常。问题是,即使我在不​​同的页面上,也只会提取第一页的文本。

以下是我正在使用的代码 -

public void extracttext()
{
TextWord[][] textWord = core.textLines(mDocView.getDisplayedViewIndex());
 int z, j;

for (z = 0; z < textWord.length; z++) {
    for (j = 0; j < textWord[z].length; j++) {
        word = word + textWord[z][j].w + " ";
    }
  }
}

我犯了什么错误?

1 个答案:

答案 0 :(得分:0)

嗯,我犯了一个非常愚蠢的错误。我忘了将单词重新初始化为“”。因此,提取的文本是在已经提取的文本之后添加的,我曾经认为文本只是从第一页提取的。