我们执行的数据验证步骤之一与输出文件中的“特殊字符”有关。这些是文本文件,以竖线分隔。今天,我们在UltraEdit中打开文件,然后执行Ctrl + F。这些输出文件的大小不等,最大的超过54GB。寻找一种更高效(又称为自动化)的方法来执行此步骤。有什么建议吗?
答案 0 :(得分:0)
使用Java 15gb文件花了30秒。
long found = Files.lines(Paths.get("dummy.txt"))
.filter(s -> s.contains("test"))
.count();
System.out.println(count);