PHP中的PDF到HTML库

时间:2012-02-20 08:47:07

标签: php pdf text

我想将包含文本的pdf文件转换为html格式。 我想检索内容(文本,格式,缩进等)并将其存储在变量中,以便以相同的格式,排列,缩进显示。

有人可以推荐我可以使用的PHP类/库(不是软件工具,不需要安装)吗?

由于

2 个答案:

答案 0 :(得分:1)

pdf2text准确地说明了它的内容:它从pdf文件中提取文本,它不会将其转换为 html标记。您可能需要使用命令行实用程序或在线服务。

有linux命令行pdftohtml工具

Poppler是另一种选择,它包含一个名为pdftohtml的实用程序

或者jPedal如果你准备好考虑一个Java应用程序

还有一系列商业应用可以做到这一点,但我猜你想要“免费”

答案 1 :(得分:0)

您可以使用FPDI - PDF-Parser(COMERCIAL)从您的pdf文件导入文本,或FPDI(免费)导入像pdf模板(您不能修改免费版本的文本)。或者你可以存储一些html格式化的模板和短代码,并使用TCPDF创建新的pdf:开源PHP类。