如何使用PHP从pdf,docx,doc获取HTML代码

时间:2017-08-18 06:34:12

标签: php converter docx doc pdf-to-html

我想使用php将任何pdf,docx,doc文件转换为html代码。与pdf中的风格相同。我没有得到适当的解决方案。

                            Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');

                            // change pdfinfo bin location
                            Config::set('pdfinfo.bin', 'C:/poppler-0.37/bin/pdfinfo.exe');
                            // initiate
                            $pdf = new Gufy\PdfToHtml\Pdf($item);

                            // convert to html and return it as [Dom Object](https://github.com/paquettg/php-html-parser)
                            $html = $pdf->html();

不适合我。

3 个答案:

答案 0 :(得分:1)

我认为this帖子可以在第一时间为您提供帮助。有了这个,您就可以使用PHP将任何pdf转换为HTML代码。

在此之后,您可以使用this post提供的帮助转换 .doc .docx < / strong>使用PHP进行PDF格式化。

我认为您现在可以为要转换为HTML的每个文档扩展构建一个函数。

祝你好运。

答案 1 :(得分:1)

我遇到了类似的问题,我找到了一个与word docs一起使用的github。它工作得相当不错,但我最近没有测试过。试试吧。

https://github.com/benbalter/Convert-Word-Documents-to-HTML

答案 2 :(得分:0)

我遇到了一个Web服务,它提供了一个用于转换文档的API。我还没有对它进行过彻底的测试,但它似乎在将Word转换为HTML时产生了不错的结果:

https://cloudconvert.org/