我想将PDF上下文提取到String中。我以前使用过PDFBox,但它不支持我在PDF中使用的很多字体。
决定改用iText。如何使用blob中的getByteStream而不是磁盘上的文件?
Blob blobPdf = ...;
File outputFile = new File("/tmp/blah/whatever.pdf");
FileOutputStream fout = new FileOutputStream(outputFile);
IOUtils.copy(blobPdf.getBinaryStream(), fout);
我想要这种逻辑但是将上下文插入到String变量中。我怎么能这样做?
@EDIT
这是我的尝试
InputStream is = resultSet.getBinaryStream(3);
PdfReader reader = new PdfReader(is);
String text = PdfTextExtractor.getTextFromPage(reader, 1);
System.out.println(text);