iText 5可以将PDF转换为HTML吗?

时间:2011-07-05 16:06:06

标签: html pdf itext

我使用iText 5创建了一个漂亮的报告,其中包含一些表格和图形。我想知道iText是否允许您将PDF转换为HTML,如果是这样的话......人们怎么能这样做?

我相信以前版本的iText允许它,但在iText 5我无法找到方法来执行此操作。

3 个答案:

答案 0 :(得分:5)

没有。 iText从未将PDF转换为HTML,只是相反。

答案 1 :(得分:2)

您是否看过http://www.jpedal.org/pdf_to_html_conversion.php - 目前有免费测试版。

答案 2 :(得分:0)

可以使用Apache Tika(它使用Apache PDFBox):

public String pdfToHtml(InputStream content) {
    PDDocument pddDocument = PDDocument.load(content);
    PDFText2HTML stripper = new PDFText2HTML("UTF-8");
    return stripper.getText(pddDocument);
}