使用Python将PDF转换为HTML

时间:2008-11-09 20:26:01

标签: python html apache pdf

如何使用Python将PDF文件转换为HTML?

我正在考虑谷歌做(或似乎做)索引PDF文件的内容。

我的最终目标是设置Apache以显示PDF文件的HTML,因此任何引导我朝这个方向发展的人都会受到赞赏。

1 个答案:

答案 0 :(得分:5)

poppler包提供了一个pdf2html实用程序,您可以使用它。还有Python binding到libpoppler。