将PDF页面下载到字符串

时间:2012-07-22 08:17:05

标签: android eclipse string pdf downloading

完成了一些基础教程后,我开始在eclipse中制作我的第一个真正的Android应用程序。我希望这个应用程序检查EditText中的文本是否与PDF页面上的文本匹配(这一个:http://www.augustinianum.eu/roosterwijzigingen/14062012.pdf(它包含我学校的日程安排更改))。我已经找到了如何使应用程序检查EditText中的文本是否匹配字符串(方法contains()),所以现在我唯一需要做的就是将该PDF页面的所有文本下载到串。但我不知道该怎么做。或者,如果PDF页面包含某个单词而不将整个网站下载到字符串,我可以查看一个方法吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

PDF不是文本文件,而是二进制文件。因此,您不应将数据下载到字符串中,而应下载到字节数组中。然后,您必须使用某些PDF库从PDF中提取文本数据。在 文本中,您可以搜索关键字。

最有趣的部分是从PDF中提取文本。您可以浏览本网站以寻找尝试相同的其他问题。这是一个quick search或者这个。