Question

我有一个数据框，其中Product为第一列，然后是12个月的销售额（每月一列）。我想“透视”数据框，最终得到一个单日期索引。

示例数据：

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(10, 1000, size=(2,12)), index=['PrinterBlue', 'PrinterBetter'], columns=pd.date_range('1-1', periods=12, freq='M'))

得到以下特性：

>>> df
           2014-01-31  2014-02-28  2014-03-31  2014-04-30  2014-05-31  \
PrinterBlue           176          77          89         279          81   
PrinterBetter         801         660         349         608         322   

           2014-06-30  2014-07-31  2014-08-31  2014-09-30  2014-10-31  \
PrinterBlue           286         831         114         996         904   
PrinterBetter         994         374         895         586         646   

           2014-11-30  2014-12-31  
PrinterBlue           458         117  
PrinterBetter         366         196

期望的结果：

   Brand           Date          Sales
PrinterBlue    2014-01-31          176
               2014-02-28           77
               2014-03-31           89
                  [...]
               2014-11-30          458
               2014-12-31          117
PrinterBetter  2014-01-31          801
               2014-02-28          660
               2014-03-31          349
                  [...]
               2014-11-30          366
               2014-12-31          196

我可以想象得到结果：

构建12个子数据帧，每个子数据帧只包含一个月的信息
透视每个数据框
连接它们

但这似乎是一种非常复杂的目标转换方式。有更好/更简单的方法吗？

Answer 1

我认为pandas melt提供了您正在寻找的功能

http://pandas.pydata.org/pandas-docs/stable/reshaping.html#reshaping-by-melt

import pandas as pd
import numpy as np
from pandas import melt

df = pd.DataFrame(np.random.randint(10, 1000, size=(2,12)), index=['PrinterBlue', 'PrinterBetter'], columns=pd.date_range('1-1', periods=12, freq='M'))

dft = df.T
dft["date"] = dft.index
result = melt(dft, id_vars=["date"])
result.columns = ["date", "brand", "sales"]
print (result)

输出：

         date          brand  sales
0  2014-01-31    PrinterBlue    242
1  2014-02-28    PrinterBlue    670
2  2014-03-31    PrinterBlue    142
3  2014-04-30    PrinterBlue    571
4  2014-05-31    PrinterBlue    826
5  2014-06-30    PrinterBlue    515
6  2014-07-31    PrinterBlue    568
7  2014-08-31    PrinterBlue     90
8  2014-09-30    PrinterBlue    652
9  2014-10-31    PrinterBlue    488
10 2014-11-30    PrinterBlue    671
11 2014-12-31    PrinterBlue    767
12 2014-01-31  PrinterBetter    294
13 2014-02-28  PrinterBetter     77
14 2014-03-31  PrinterBetter     59
15 2014-04-30  PrinterBetter    373
16 2014-05-31  PrinterBetter    228
17 2014-06-30  PrinterBetter    708
18 2014-07-31  PrinterBetter     16
19 2014-08-31  PrinterBetter    542
20 2014-09-30  PrinterBetter    577
21 2014-10-31  PrinterBetter    141
22 2014-11-30  PrinterBetter    358
23 2014-12-31  PrinterBetter    290

Pandas数据帧：多个时间/日期列到单个日期索引

1 个答案: