以列为基础附加csv文件

时间:2014-03-27 16:12:56

标签: python bash sed awk append

我尝试合并多个CSV文件,其配置如下:

File1

DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;
2014M02;0.9;1.5;
2014M01;-5.4;-4.4;
2013M11;-7.9;-9.2;
2013M10;-8.6;-14.0;


File2

DATE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;1.5;6.7;
2014M01;-8.8;-4.4;
2013M11;-2.5;-9.6;
2013M10;-8.9;-11.4;

我希望按列合并它们,保留File1的第一列,但删除File2的第二列。所需的输出是:

DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;0.9;1.5;
2014M01;-5.4;-4.4;-5.4;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;

我在考虑使用sed,但我不熟悉这种用法,特别是在专栏中。我想到了命令paste,但我找不到任何与我试图做的事情有关的事情。

欢迎任何建议。

最佳。

2 个答案:

答案 0 :(得分:1)

awk可能会:

awk -F\; -v OFS=\; 'FNR==NR {a[$1]=$0;next} {print a[$1]$2,$3}' file1 file2
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE
2014M02;0.9;1.5;1.5;6.7
2014M01;-5.4;-4.4;-8.8;-4.4
2013M11;-7.9;-9.2;-2.5;-9.6
2013M10;-8.6;-14.0;-8.9;-11.4

在您的输出示例中,您对M02M01有所不同,也许您写错了。

答案 1 :(得分:1)

使用join命令:

$ join -t\; -j 1 file1 file2 | sed 's/;;/;/g'
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;1.5;6.7;
2014M01;-5.4;-4.4;-8.8;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;

或者如果您不想通过sed进行管道传输,可以通过设置输出格式来执行(稍微冗长一点):

$ join -t\; -j 1 -o 1.1 1.2 1.3 2.2 2.3 2.4 file1 file2 
DATE;BS-ICI,NSA,BAL,AT;BS-ICI,NSA,BAL,BE;BS-BYL,NSA,BAL,AT;BS-NAN,NSA,BAL,BE;
2014M02;0.9;1.5;1.5;6.7;
2014M01;-5.4;-4.4;-8.8;-4.4;
2013M11;-7.9;-9.2;-2.5;-9.6;
2013M10;-8.6;-14.0;-8.9;-11.4;