我有一个员工小时的CSV文件。每行包含员工,日期和小时的列。一个例子是:
Employee,Date,Hours
A,2015-01-02,10
A,2015-01-03,8
A,2015-01-04,5
B,2015-01-02,8
B,2015-01-03,2
C,2015-01-03,8
C,2015-01-04,8
我正在寻找的是Pandas数据框,其中行索引是日期,每列是雇员,数据是小时数,例如:
Date A B C
2015-01-02 10 8 None
2015-01-03 8 2 8
2015-01-04 5 None 8
也许我在寻找错误的术语,但是在pandas中有一种简单的方法可以在导入csv文件时进行这样的转换吗?
答案 0 :(得分:2)
使用read_csv
加载csv之后:df = pd.read_csv(file_path)
然后您可以使用pivot
并分别将列Employee和Date作为列和索引传递:
In [91]:
df.pivot(columns='Employee', index='Date')
Out[91]:
Hours
Employee A B C
Date
2015-01-02 10 8 NaN
2015-01-03 8 2 8
2015-01-04 5 NaN 8