使用pdftohtml poppler实用程序将多页PDF转换为单个html文件

时间:2015-04-20 10:22:35

标签: poppler pdf-parsing pdf-to-html

我正在使用poppler实用程序将PDF文档转换为HTML。但是它为每个页面创建了单独的html文件,但是在将pdf转换为html之后我想要一个HTML文件。

我使用了以下语法:

pdftohtml -c abc.pdf

但它创建了abc-1.html,abc-2.html,....等

我也试过了pdftohtml -c abc.pdf abc.html但没有期待输出。

任何人都可以告诉如何在单个文件中获取html输出而不是多个html文件吗?

1 个答案:

答案 0 :(得分:4)

我用-s选项实现了这个

例如:

pdftohtml -c -s -noframes abc.pdf abc.html