CSV文件 - 合并,如果具有相同值的列,则执行以下操作:

时间:2013-06-17 17:45:56

标签: python csv awk

我正在努力整合2个CSV文件。

文件由以下列组成:

首先.csv:

SKU | Name | Quantity | Active
121 | Jablko | 23 | 1

另一个.csv包含以下内容:

SKU | Quantity
232 | 4
121 | 2

我想用2.csv中的数据更新1.csv,在Linux中,任何想法如何以最好的方式做到这一点?蟒?

4 个答案:

答案 0 :(得分:3)

awk解决方案:

awk -F ' \\| ' -v OFS=' | ' '
    NR == FNR {val[$1] = $2; next}
    $1 in val {$3 = val[$1]} 
    {print}
' 2.csv 1.csv

FS输入字段分隔符变量被视为正则表达式,而输出字段分隔符被视为普通字符串,因此管道字符的处理方式不同。

答案 1 :(得分:2)

这是gnu awk(awk -f script.awk file2.csv file1.csv)的解决方案:

BEGIN {FS=OFS="|"}
FNR == NR {
     upd[$1] = $2
     next
}

{$3 = upd[$1]; print}

答案 2 :(得分:1)

未经测试,但有些内容如下:

import csv
from itertools import islice

with open('first.csv') as f1, open('second.csv') as f2, open('new', 'wb') as fout:
    sku_to_qty = dict(islice(csv.reader(f2, delimiter='|'), 1, None)) # create lookup table
    csvin = csv.reader(f1, delimiter='|') # input
    csvout = csv.writer(fout, delimiter='|') # output
    csvout.writerow(next(csvin)) # write header
    for row in csvin:
        row[2] = sku_to_qty.get(row[0], row[2]) # update or presume the same
        csvout.writerow(row)

答案 3 :(得分:1)

awk 'BEGIN{FS=OFS="|"}NR==FNR{a[$1]=$2;next}{$3=a[$1]" "}1' second.csv first.csv