使用PHP从PDF文件中提取HTML表格?

时间:2013-11-04 13:00:13

标签: php parsing pdf

我想知道是否可以从PDF文件中提取数据表,数组或类似数据,以便我可以使用PHP导入表数据? 我安装了DomPDF来创建PDF文件,但是这里没有阅读PDF的选项。 如果我在PHP中读取PDF文件,我会得到一个编码字符串:

%PDF-1.5 5 0 obj <>>> endobj 6 0 obj <>stream x��ێ+��W�\`��E���u

任何帮助都将不胜感激。

亚当

1 个答案:

答案 0 :(得分:0)

这篇文章相当陈旧,但似乎有相当多的观点。

我正在开展一个类似的项目并且在cppreference上取得了一些成功。 HTML返回只是一堆绝对定位的p标签,但是如果你的pdf格式是一致的,你可能会有一些运气工作来解析表或者至少得到你需要的数据。

确保安装了poppler实用程序。