我遇到了问题,无法继续我的项目。我使用PDFBox解析PDF并能够以文本格式转换整个pdf,如下面的代码所示:
public static PdfValues readPdf() throws IOException {
System.out.println("Main Method Started");
File file = new File("D:/po/temp/output.pdf");
PDDocument document = PDDocument.load(file);
PDFTextStripper pdfStripper = new PDFTextStripper();
String text = pdfStripper.getText(document);
text = text.trim();
text = text.replaceAll(" +", " ");
text = text.replaceAll("(?m)^[ \t]*\r?\n", "");
// System.out.println(text);
deleteIfExist();
writeToFile(text);
PdfValues infos = readData();
document.close();
System.out.println("Main Method Ended");
return infos;
}
但我没有得到条形码值,这意味着它不是文本。任何人都可以帮我如何解析这个条形码值作为图像或实际值?感谢您阅读此问题。