手动将PDF表列作为数据库记录插入数据库表

时间:2018-09-23 06:08:56

标签: php mysql excel pdf ms-word

我正在结果系统上工作,我必须上传学校的所有结果。但是学校以表格形式向我提供了结果。我有 8个PDF文件。每个文件都有 1600 个页面,每个页面都有一个表,其中包含 200个学生成绩。每个页面上的每个表格都有 3列。我想将按列数据插入数据库。 MySQL数据库接受这种类型的表:

-----------------------
Roll#  | Name | Marks |
-----------------------

但是我的PDF包含具有3列的这种类型的表。 问题是如何将这些列与每个表分开? 这是我的PDF文件图片:

PDF image Containing Table with Three Columns

1 个答案:

答案 0 :(得分:1)

如果您无法接收到结果的源表(电子表格等),一种解决方案是将PDF转换为表,选择适当的列,然后将其导入数据库。您可以使用光学字符识别应用程序转换PDF,定义要提取的PDF的哪些部分。我使用了称为Omnipage的软件。将pdf加载到软件中并定义感兴趣的区域是一个手动过程!