如何在服务器上转换pdf文件并从中提取数据?

时间:2017-12-17 17:31:51

标签: android pdf client-server

我们的考试结果以pdf格式载入我们大学的网站,其中包含所有大学学生的成绩,包含100-150页pdf ..一个人上传了一个应用程序在游戏商店,我们可以看到我们的结果考试而不是下载pdf和搜索我们的注册号码...当我问那个人是否通过gmail你是如何做到这一点他给了我一个提示 - 他说我们基本上处理我们服务器上的PDF并向应用程序提供结果通过我们自己的API。我想知道这是什么意思以及它是如何完成的..我想学习这个???

1 个答案:

答案 0 :(得分:0)

也许有一种方法可以做到这一点:

  1. 使用程序处理PDF以提取文本。使用付费Adobe Acrobat等程序或PyPDF2等免费编程库。如果您使用的是python,可以通过输入“pip install PyPDF2”来安装它

  2. 处理数据并加入某种形式的集合,即地图/字典。

  3. 创建一个Web API,可能使用SpringBoot并创建一个简单的控制器来查找请求。我认为您仍然可以在Heroku

  4. 上免费托管
  5. 对您的Android应用进行编码以访问Restful API,并根据您的条件拨打电话。