将PDF上下文转换为blob中的字符串

时间:2018-02-02 14:29:50

标签: java string pdf itext blob

我想将PDF上下文提取到String中。我以前使用过PDFBox,但它不支持我在PDF中使用的很多字体。

决定改用iText。如何使用blob中的getByteStream而不是磁盘上的文件?

Blob blobPdf = ...;
File outputFile = new File("/tmp/blah/whatever.pdf");
FileOutputStream fout = new FileOutputStream(outputFile);
IOUtils.copy(blobPdf.getBinaryStream(), fout);

我想要这种逻辑但是将上下文插入到String变量中。我怎么能这样做?

@EDIT

这是我的尝试

InputStream is = resultSet.getBinaryStream(3);
PdfReader reader = new PdfReader(is);

String text = PdfTextExtractor.getTextFromPage(reader, 1);

System.out.println(text);

0 个答案:

没有答案