标签: python html apache pdf
如何使用Python将PDF文件转换为HTML?
我正在考虑谷歌做(或似乎做)索引PDF文件的内容。
我的最终目标是设置Apache以显示PDF文件的HTML,因此任何引导我朝这个方向发展的人都会受到赞赏。
答案 0 :(得分:5)
poppler包提供了一个pdf2html实用程序,您可以使用它。还有Python binding到libpoppler。