在非常大的文件中查找子字符串(javaSE)

时间:2015-01-24 15:10:06

标签: java regex substring

我需要在一个非常大的文本文件(5-10GB)中找到一个子字符串。你有什么建议我这种大小的简单快速的文件处理?

UPD: 这个算法在文件中搜索一个单词,但在我看来,它可以轻松处理大文件:

File textFile = new File("text.txt");

        BufferedReader fileOut = new BufferedReader(new FileReader( textFile ) );
        String s;

        int a = 1;
        while((s = fileOut.readLine()) != null) {
            if(s.contains("findword"))
            System.out.println(a + ": " + s);
            a++;
        }

        fileOut.close();

1 个答案:

答案 0 :(得分:0)

提示:看看Knuth-Morris-Pratt算法。