我在多千兆字节文件上搜索双倍空格或更多空格。我想在搜索(正则表达式?)多行换行(换行符)时获得最佳性能。有没有比“\ n {2,}”更快的东西?我正在使用Java和/或Perl并假设类似于Unix。另外,我假设两个平台都是嵌入式系统(即没有第三方库)。
编辑:我正在尝试捕获多行馈送之间的数据。目前使用Java Scanner类来捕获数据。答案 0 :(得分:0)
在Perl中,您可以将$ /变量设置为“\ n \ n”,然后只读取文件中的行。每个“行”将是两个新行之间的所有文本。
open my $fh, "<", "big_file.txt" or die "um, where did it go?";
local $/ = "\n\n";
while (my $rec = <$fh>) {
.. process $rec
}