我尝试合并多个CSV文件,其配置如下:
File1
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;
2014M02;0.9;1.5;
2014M01;-5.4;-4.4;
2013M11;-7.9;-9.2;
2013M10;-8.6;-14.0;
File2
DATE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;1.5;6.7;
2014M01;-8.8;-4.4;
2013M11;-2.5;-9.6;
2013M10;-8.9;-11.4;
我希望按列合并它们,保留File1的第一列,但删除File2的第二列。所需的输出是:
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;0.9;1.5;
2014M01;-5.4;-4.4;-5.4;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;
我在考虑使用sed
,但我不熟悉这种用法,特别是在专栏中。我想到了命令paste
,但我找不到任何与我试图做的事情有关的事情。
欢迎任何建议。
最佳。
答案 0 :(得分:1)
这awk
可能会:
awk -F\; -v OFS=\; 'FNR==NR {a[$1]=$0;next} {print a[$1]$2,$3}' file1 file2
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE
2014M02;0.9;1.5;1.5;6.7
2014M01;-5.4;-4.4;-8.8;-4.4
2013M11;-7.9;-9.2;-2.5;-9.6
2013M10;-8.6;-14.0;-8.9;-11.4
在您的输出示例中,您对M02
和M01
有所不同,也许您写错了。
答案 1 :(得分:1)
使用join
命令:
$ join -t\; -j 1 file1 file2 | sed 's/;;/;/g'
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;1.5;6.7;
2014M01;-5.4;-4.4;-8.8;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;
或者如果您不想通过sed
进行管道传输,可以通过设置输出格式来执行(稍微冗长一点):
$ join -t\; -j 1 -o 1.1 1.2 1.3 2.2 2.3 2.4 file1 file2
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;1.5;6.7;
2014M01;-5.4;-4.4;-8.8;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;