我正在尝试创建一个数据透视表,该数据表显示每个月储备金的发展情况。我遇到的问题是,当我使用熊猫创建数据透视表时,它正在为同一索赔编号创建单独的订单项。
下面的代码显示了所需的输出,而下表显示了我的实际数据给我的东西。
要特别注意索赔号200932768。它应同时显示2月和3月的200000储备金。
data={'Claim Number':[200932768,102349182,200943556,200932768,300943556,400943556],'Reserve':[200000,50000,0,200000,5000,0],'Key':['Feb','Feb','Feb','March','March','March']}
df=pd.DataFrame(data)
table=df.pivot_table(index='Claim Number',columns='Key',values='Reserve')
我尝试过将“声明编号”字段从dtype对象更改为int,但是相同的问题仍然存在。对于原始数据文件中的上下文,我们提供了两个电子表格。一个用于2月,另一个用于3月。我将这两个表都导入为CSV,并在创建数据透视表之前将这些表连接起来。
Reserve
Key Feb March
Claim Number|
----------- |------|
102349182 |50000 | NaN
200932768 |200000| NaN
200943556 |0 | NaN
300943556 |NaN | 5000
400943556 |NaN | 0
200932768 |NaN |200000