Question

我在数据分析领域还很陌生。我有一个非常大的数据文件，其中包含数百万行，但以相同的模式重复（100步时间）。我需要提取每10000行100行形成的块。这样，我将丢弃相同的无用数据。

提前谢谢

Answer 1

awk来营救！

$ awk '(NR-1)%10000<100'

Answer 2

也许像这样：

awk 'NR % 10000 == 0 { line = 0 } line++ < 100' input.txt

可以解决问题。