从终端过滤大文件中的值

时间:2019-06-12 19:49:55

标签: bash cygwin

我有两个文件:

f1.csv-它包含800行,具有唯一的id

id
1
2
3
4
5

f2.xlsx(Sheet1)-它包含20列和许多行(200Mb)。

typeID  col2   col2 ...
1
1
1
2
2
2
2
2
3
4
10
10
...

我想减少f2.xlsx的大小,以便在Jupyter Notebook(Python)中打开数据文件并使用熊猫对其进行分析。特别是,我只想选择与typeID中的id匹配的f1.csv值。 有什么方法可以使用终端命令进行过滤,然后将过滤后的文件保存为CSV格式?

0 个答案:

没有答案