使用java将pdf表格数据转换为excel

时间:2018-05-10 12:52:52

标签: java csv pdf pdfbox

我想将我的pdf表格文件转换为CSV文件。

这是我写的代码,但我只得到5列名称而不是它们的值。

代码 -

public static ArrayList<String[]> readParaFromPDF(String pdfPath, int pageNoStart, int pageNoEnd, int noOfColumnsInTable) {
    ArrayList<String[]> objArrayList = new ArrayList<>();
    try {
        PDDocument document = PDDocument.load(new File(pdfPath));
        document.getClass();
        if (!document.isEncrypted()) {
            PDFTextStripperByArea stripper = new PDFTextStripperByArea();
            stripper.setSortByPosition(true);
            PDFTextStripper tStripper = new PDFTextStripper();
            tStripper.setStartPage(pageNoStart);

            tStripper.setEndPage(pageNoEnd);
            String pdfFileInText = tStripper.getText(document);
            // split by whitespace
            String Documentlines[] = pdfFileInText.split("\\r?\\n");
            for (String line : Documentlines) {
                String lineArr[] = line.split("\\s+");
                if (lineArr.length == noOfColumnsInTable) {
                    for (String linedata : lineArr) {
                        System.out.print(linedata + " ");
                    }
                    System.out.println("");
                    objArrayList.add(lineArr);
                }
            }
        }
    } catch (Exception e) {
        System.out.println("Exception " + e);
    }
    return objArrayList;
}

0 个答案:

没有答案