我如何解析android中的PDF文件?

时间:2014-03-09 21:52:40

标签: java android pdf pdf-generation

我正在开发Android应用程序。此应用程序允许用户突出显示PDF文件中的单词。然后必须提取这些单词,那么如何解析PDF文件以从文件中提取单词而不需要任何库?任何人都可以帮助我吗?

2 个答案:

答案 0 :(得分:0)

如果您不想使用图书馆,则必须自己编码。 Android SDK中没有用于PDF操作的任何内置类。

但是你必须使用Libary并查看这个问题:

PDF Library to rendering the PDF files in Android

答案 1 :(得分:0)

您可以使用iText库轻松地在android上轻松解析PDF,就像我在项目中所做的那样,方法是解析资产中的pdf文件并将其显示在android listview中。

iTextG链接:https://developers.itextpdf.com/itextg-android

assetManager = getAssets();

try{
    InputStream inputStream = assetManager.open("sample.pdf");
    String parsedText = "";
    PdfReader reader = new PdfReader(inputStream);
    int n = reader.getNumberOfPages();

    for (int i = 0; i < n; i++)
        parsedText = parsedText + PdfTextExtractor.getTextFromPage(reader, i + 1).trim() + "\n";

    String[] data = parsedText.split("\n");

    for(String d : data){
        patients.add(d);
    }

    reader.close();

}catch (FileNotFoundException e){
    Toast.makeText(this, "File Not Found", Toast.LENGTH_SHORT).show();
}catch (IOException e){
    Toast.makeText(this, "IO Error reading input stream", Toast.LENGTH_SHORT).show();
}