标签: linux bash terminal idl
我在数据分析领域还很陌生。 我有一个非常大的数据文件,其中包含数百万行,但以相同的模式重复(100步时间)。我需要提取每10000行100行形成的块。这样,我将丢弃相同的无用数据。
提前谢谢
答案 0 :(得分:1)
awk来营救!
awk
$ awk '(NR-1)%10000<100'
答案 1 :(得分:0)
也许像这样:
awk 'NR % 10000 == 0 { line = 0 } line++ < 100' input.txt
可以解决问题。