我正在开发Android应用程序。此应用程序允许用户突出显示PDF文件中的单词。然后必须提取这些单词,那么如何解析PDF文件以从文件中提取单词而不需要任何库?任何人都可以帮助我吗?
答案 0 :(得分:0)
如果您不想使用图书馆,则必须自己编码。 Android SDK中没有用于PDF操作的任何内置类。
但是你必须使用Libary并查看这个问题:
答案 1 :(得分:0)
您可以使用iText库轻松地在android上轻松解析PDF,就像我在项目中所做的那样,方法是解析资产中的pdf文件并将其显示在android listview中。
iTextG链接:https://developers.itextpdf.com/itextg-android
assetManager = getAssets();
try{
InputStream inputStream = assetManager.open("sample.pdf");
String parsedText = "";
PdfReader reader = new PdfReader(inputStream);
int n = reader.getNumberOfPages();
for (int i = 0; i < n; i++)
parsedText = parsedText + PdfTextExtractor.getTextFromPage(reader, i + 1).trim() + "\n";
String[] data = parsedText.split("\n");
for(String d : data){
patients.add(d);
}
reader.close();
}catch (FileNotFoundException e){
Toast.makeText(this, "File Not Found", Toast.LENGTH_SHORT).show();
}catch (IOException e){
Toast.makeText(this, "IO Error reading input stream", Toast.LENGTH_SHORT).show();
}