我如何从android中的pdf文件中获取单词

时间:2014-06-19 16:09:45

标签: java android pdf

我是android编程的新手。 我正在尝试构建一个使用pdf文件的小应用程序。 有没有办法得到它们? 也许是一个使用pdf格式的库?

2 个答案:

答案 0 :(得分:1)

PDF阅读/写作是许多Android开发人员面临的一个巨大问题,遗憾的是,开源资源很少。大多数可以在JVM上运行的库使用swing和其他与Android VM不兼容的库。

如果您允许用户阅读pdf并选择要从中提取的文本,

MuPDFPlugPDF将起作用。两者都是免费的,包括PlugPDF,如果你是独立开发者,它是免费的。

如果您愿意付钱,有许多商业图书馆能够从pdf中提取文本(iText和Aspose浮现在脑海中)。

答案 1 :(得分:0)

如果您正在寻找高质量的商业解决方案,请查看Aspose.Pdf for Android。它是一个PDF处理库,使您可以创建,操作和编辑文档。功能包括:

  

PDF压缩选项,支持图形对象,广泛的超链接功能,扩展安全控制,自定义字体处理,与数据源集成,添加或删除书签,使用附件和注释,导入或导出PDF表单数据,处理文本和图像,分割,连接,提取或插入页面,将页面转换为图像等等。

这是一个从PDF文件中提取文本的简单示例。

String input = new File(Environment.getExternalStorageDirectory(), "Document1.pdf").toString();
// Load the PDF document
Document doc = new Document(input);
// Create a text absorber
TextAbsorber absorber = TextAbsorber();
// Accept page 1 for absorber.
doc.getPages().get_Item(1).accept(absorber);
// Extract all text from page 1
String text = absorber.getText();
Log.i("PDF", text);

PS:我是Aspose的开发人员。