解析大型文本文件并将数据移动到数据库中

时间:2015-01-30 13:50:52

标签: java stored-procedures javadb dbconnection

我有一个1.5Gb左右的大文本文件。我必须逐行解析文件并将行插入Derby数据库。我阅读了很多关于性能以及如何解析文件等的论坛。我的问题是我对我的所有进程进行了基准测试,并且需要读取和解析一行1ms,我怎么能确保我的行和尝试插入的是不存在的,如果是,那么我必须对它进行一些更新。这部分过程大约需要9毫秒。

总共10毫秒,这个文件包含大约1000万行。

我使用PreparedStatement查询。

有什么方法可以加快我的代码的查询部分吗?

2 个答案:

答案 0 :(得分:2)

你是否转向Autocommit?

dbConnection.setAutoCommit(false);

使用批量插入而不是像这样逐个插入:

    Connection dbConnection = null;
    PreparedStatement preparedStatement = null;

    String insertTableSQL = "INSERT INTO DBUSER"
            + "(USER_ID, USERNAME, CREATED_BY, CREATED_DATE) VALUES"
            + "(?,?,?,?)";

    try {
        dbConnection = getDBConnection();
        preparedStatement = dbConnection.prepareStatement(insertTableSQL);

        dbConnection.setAutoCommit(false);

        preparedStatement.setInt(1, 101);
        preparedStatement.setString(2, "mkyong101");
        preparedStatement.setString(3, "system");
        preparedStatement.setTimestamp(4, getCurrentTimeStamp());
        preparedStatement.addBatch();

        preparedStatement.setInt(1, 102);
        preparedStatement.setString(2, "mkyong102");
        preparedStatement.setString(3, "system");
        preparedStatement.setTimestamp(4, getCurrentTimeStamp());
        preparedStatement.addBatch();

        preparedStatement.setInt(1, 103);
        preparedStatement.setString(2, "mkyong103");
        preparedStatement.setString(3, "system");
        preparedStatement.setTimestamp(4, getCurrentTimeStamp());
        preparedStatement.addBatch();

        preparedStatement.executeBatch();

        dbConnection.commit();

        System.out.println("Record is inserted into DBUSER table!");

    } catch (SQLException e) {

        System.out.println(e.getMessage());
        dbConnection.rollback();

    } finally {

        if (preparedStatement != null) {
            preparedStatement.close();
        }

        if (dbConnection != null) {
            dbConnection.close();
        }

    }

查看:https://builds.apache.org/job/Derby-docs/lastSuccessfulBuild/artifact/trunk/out/tuning/tuningderby.pdf

答案 1 :(得分:0)

由于您已经在使用SQLiteStatement,我唯一能想到的是确保您在i / o操作中使用BufferedInputStream / BufferedOutputStream

修改的 我的不好,这个答案是针对Android开发的