按列1和标题行重新排列xref / csv

时间:2017-05-17 13:39:04

标签: python linux bash csv

希望有人可能之前遇到过这种事情......我在Linux服务器上有一个csv文件,我需要按摩'我可以在另一个产品中用作查找表的格式。当前的文件格式不适合这个其他产品,所以我希望将数据重新排列成我可以使用的东西。

我尝试过使用bash脚本但没有太大的成功(主要是性能),但我怀疑,由于我对该语言的了解非常有限,Python将是一个更好的候选者。

我当前的文件有一个标题行,第一列是日期,即

Date,USD,JPY,BGN,CYP,
2017-04-28,1.093,121.76,1.9558,26.922,
2017-04-27,1.0881,121.27,1.9558,26.937,

(这是一个非常简单的例子!实际上,有43列和4,600行)

我的目标是创建一个看起来像......

的输出文件
Date, Currency, FX_Rate
2017-04-28, USD, 1.093
2017-04-28, JPY, 121.76
2017-04-28, BGN, 1.9558
2017-04-28, CYP, 26.922
2017-04-27, USD, 1.0881
2017-04-27, JPY, 121.27
2017-04-27, BGN, 1.9558
2017-04-27, CYP, 26.937

(这个空间是无关紧要的 - 我只是添加它们试图让它更清晰)

感谢您提供的任何帮助,

标记。

1 个答案:

答案 0 :(得分:0)

这可以使用Python内置的csv库完成。以下内容适用于Python 2.x安装。

import csv

with open('input.csv', 'rb') as f_input, open('output.csv', 'wb') as f_output:
    csv_input = csv.reader(f_input)
    csv_output = csv.writer(f_output)

    header = next(csv_input)
    csv_output.writerow(["Date", "Currency", "FX_Rate"])

    for row in csv_input:
        date = row[0]

        for index, currency in enumerate(row[1:], start=1):
            csv_output.writerow([date, header[index], currency])

给你:

Date,Currency,FX_Rate
2017-04-28,USD,1.093
2017-04-28,JPY,121.76
2017-04-28,BGN,1.9558
2017-04-28,CYP,26.922
2017-04-27,USD,1.0881
2017-04-27,JPY,121.27
2017-04-27,BGN,1.9558
2017-04-27,CYP,26.937

如果使用Python 3,则需要更改如下:

with open('input.csv', newline='') as f_input, open('output.csv', 'w', newline='') as f_output: