使用Apache POI和JDBC将大型结果集写入.xlsx文件

时间:2017-12-06 05:18:31

标签: java oracle java-ee apache-poi fileoutputstream

我正在尝试将一个大的(总行数不超过200万)结果集写入.xlsx文件。 为了克服堆空间或内存错误,我决定在每个调用中从表中获取一些有限的记录集,并将其附加到文件中。 这些有限的记录集全部由rownum排序。在每次调用表时我都会获取50K记录,最后在从表中获取所有记录之后将其附加到.xlsx文件中。 目前我只在每张表中放入600000条记录。我目前的逻辑如下。

但是下面的逻辑需要很多时间来创建.xlsx文件。有什么办法可以减少时间吗? 创建第二张纸后它也会失败。

    String query="select count(*) from employee";
    String actquery="";
    Class.forName("oracle.jdbc.driver.OracleDriver").newInstance();
    conn = DriverManager.getConnection(jdbcURL,user,passwd);
    stmt = conn.createStatement();
    rs = stmt.executeQuery(query);
    stmt.setFetchSize(1000);
    int rowcounter;
    int increaseCount=50000;
    int jdbclimit=50000;//jdbc
    int excelrowlimit=600000;
    int excellimit=600000;
    int rownumStartCnt=0;
    int rownumEndCnt=0;
    if(rs.next()){
    outStream = new FileOutputStream("D:\\Test.xlsx",true);
    int count=rs.getInt(1);

    System.out.println("Total records"+count);
    if(count>0)
    {
    int sheets= count/excelrowlimit;
    if(count%excelrowlimit>0){
           sheets = sheets+1;
    }
    for(int scount=1;scount<=sheets;scount++){
    sheet =  workbook.createSheet("GapHistory-"+scount);
    rowcounter=1;
    System.out.println("Sheet:"+scount);
    System.out.println("limit is "+jdbclimit);
    while(rowcounter<excelrowlimit)
    {
    rownumStartCnt=rownumEndCnt+1;
    rownumEndCnt=jdbclimit;
    jdbclimit=jdbclimit+increaseCount;
    if(rownumEndCnt>excellimit){
           rownumEndCnt=excellimit;
    }
    if(rownumStartCnt>count){
     break;
    }
    PreparedStatement stmt2 = null;
    ResultSet rs2 =null;
    ResultSetMetaData rsmd=null;              

    actquery=actquery+"SELECT * FROM (SELECT t.*, ROW_NUMBER() OVER (ORDER BY employee_number) rnum  FROM employee t) WHERE rnum BETWEEN ? and ?";
    stmt2 = conn.prepareStatement(actquery);
    stmt2.setInt(1,rownumStartCnt);
    stmt2.setInt(2,rownumEndCnt);
    rs2 = stmt2.executeQuery();
    System.out.println("Start row-->"+rownumStartCnt+"End row--->"+rownumEndCnt);
    rsmd = rs2.getMetaData();
    stmt2.setFetchSize(1000);
    rs2.setFetchDirection(ResultSet.FETCH_FORWARD);
    while(rs2.next())
    {

    if(rowcounter==1)
    {
           row = sheet.createRow(rowcounter);
           for(int i=1;i<=68;i++)
           {
            cell = row.createCell(i);
            cell.setCellValue(rsmd.getColumnName(i));                                                                                                                                         

           }

    }
    rowcounter++;

    for(int i=1;i<=68;i++)
    {
           if(i==1)
           {
           row = sheet.createRow(rowcounter);
           }

           cell = row.createCell(i);
           cell.setCellValue(rs2.getString(i));

    }
    }
    actquery="";

                        }
 excellimit = excellimit+excelrowlimit;// Got rid with exception after adding this line
                        }
          }
    }

2 个答案:

答案 0 :(得分:1)

java.sql.SQLException: ORA-01000: maximum open cursors exceeded

这意味着你打开了许多ResultSet而没有关闭它们。最终你的驱动程序资源耗尽。完成后,您必须关闭每个ResultSet

而BTW,XLSX的最大行数为2 ^ 20,即1,048,576。您无法在XLSX工作表中存储200万行。

答案 1 :(得分:-1)

可能是您的ArrayList溢出并导致Oracle将数据存储回List对象的漫长等待时间。尽量减少你的逻辑,限制小于200000或100000。