Question

我有一个数据框：

    df1=pd.DataFrame({
        'ID':[101,102],
        'Name':['Axel','Bob'],
        'US':['GrA','GrC'],
        'Europe':['GrB','GrD'],
        'AsiaPac':['GrZ','GrF']
     })

我想改为：

    df2=pd.DataFrame({
    'ID':[101,101,101,102,102,102],
    'Name':['Axel','Axel','Axel','Bob','Bob','Bob'],
    'Region':['US','Europe','AsiaPac','US','Europe','AsiaPac'],
    'Group':['GrA','GrB','GrZ','GrC','GrD','GrF']
})

我该怎么办？大熊猫有一个交叉表功能，但它没有这样做。在Qlik中，我只会做

    Crosstable(Region,Group,2)  
    LOAD
        ID,
        Name,
        US,
        Europe,
        AsiaPac

我会从df1转到df2。我怎么能在python（pandas或其他）中做到这一点？

Answer 1

这实质上是将您的数据从宽格式转换为长格式，正如R语言中所知。在pandas中，您可以使用pd.melt：

执行此操作

pd.melt(df1, id_vars=['ID', 'Name'], var_name='Region', value_name='Group')
#     ID  Name   Region Group
# 0  101  Axel  AsiaPac   GrZ
# 1  102   Bob  AsiaPac   GrF
# 2  101  Axel   Europe   GrB
# 3  102   Bob   Europe   GrD
# 4  101  Axel       US   GrA
# 5  102   Bob       US   GrC

如果您需要在ID或Name和Group上对列进行排序，就像在示例输出中一样，您可以将.sort_values()添加到表达式中：

pd.melt(df1, id_vars=['ID', 'Name'], var_name='Region', value_name='Group').sort_values(['ID', 'Group'])
#     ID  Name   Region Group
# 4  101  Axel       US   GrA
# 2  101  Axel   Europe   GrB
# 0  101  Axel  AsiaPac   GrZ
# 5  102   Bob       US   GrC
# 3  102   Bob   Europe   GrD
# 1  102   Bob  AsiaPac   GrF

Answer 2

你可以尝试

第1次

stack()

   df1.set_index(['ID','Name']).stack().reset_index().rename(columns={'level_2':'Region',0:'Group'})
Out[890]: 
    ID  Name   Region Group
0  101  Axel  AsiaPac   GrZ
1  101  Axel   Europe   GrB
2  101  Axel       US   GrA
3  102   Bob  AsiaPac   GrF
4  102   Bob   Europe   GrD
5  102   Bob       US   GrC

第二

pd.wide_to_long，即使它有点矫枉过正。：）

df1=df1.rename(columns={'AsiaPac':'Group_AsiaPac','Europe':'Group_Europe','US':'Group_US'})
pd.wide_to_long(df1,['Group'], i=['ID','Name'], j='Region',sep='_',suffix='.').reset_index()

Out[918]: 
    ID  Name   Region Group
0  101  Axel  AsiaPac   GrZ
1  101  Axel   Europe   GrB
2  101  Axel       US   GrA
3  102   Bob  AsiaPac   GrF
4  102   Bob   Europe   GrD
5  102   Bob       US   GrC

像Qlik一样在Pandas中做Crosstable？

2 个答案: