我使用iText 5
创建了一个漂亮的报告,其中包含一些表格和图形。我想知道iText是否允许您将PDF转换为HTML,如果是这样的话......人们怎么能这样做?
我相信以前版本的iText
允许它,但在iText 5
我无法找到方法来执行此操作。
答案 0 :(得分:5)
没有。 iText从未将PDF转换为HTML,只是相反。
答案 1 :(得分:2)
您是否看过http://www.jpedal.org/pdf_to_html_conversion.php - 目前有免费测试版。
答案 2 :(得分:0)
可以使用Apache Tika(它使用Apache PDFBox):
public String pdfToHtml(InputStream content) {
PDDocument pddDocument = PDDocument.load(content);
PDFText2HTML stripper = new PDFText2HTML("UTF-8");
return stripper.getText(pddDocument);
}