Question

我的问题是如此笼统，以至于我敢肯定它可能是重复的，但是我找不到答案...为此，我事先表示歉意！

我有以下问题：

让我们考虑通过以下几行获得的熊猫数据集：

import numpy as np
import pandas as pd

dates = pd.date_range( '20130101', periods=6 )
df = pd.DataFrame( np.random.randn( 6, 4 ), index=dates, columns=list( 'ABCD' ) )
df2 = pd.DataFrame ( [["dog", "dog", "snake", "cat"],["mammel", "mammel", "reptilian", "mammel"]], columns=list('ABCD'))
df2 = df2.append(df)

其中给出以下结构：

                            A         B          C          D
0                         dog       dog      snake        cat
1                      mammel    mammel  reptilian     mammel
2013-01-01 00:00:00  0.876641  -1.23665   0.375619  -0.642984
2013-01-02 00:00:00  -1.10135  0.264016  0.0893244     1.7381
2013-01-03 00:00:00 -0.551488  0.301711  -0.682017     1.4073
2013-01-04 00:00:00 -0.141452 -0.514909   -2.99863 -0.0283258
2013-01-05 00:00:00  -1.25555    1.1793   0.932212  -0.441398
2013-01-06 00:00:00  0.349649 -0.781957  0.0733772   0.810805

我想将与0和1对应的值作为列属性。例如，我想保留所有对应于Mammel（A，B，D）的列，但我只对对应于日期的值感兴趣。

因此，换句话说，我正在尝试找到一种通过关键字或值（在此称为属性）组合来处理原始数据集的子集的方法。

我相信在R数据帧结构中也可以做到这一点，但是我找不到最佳的pythonic / pandatic方法！

在此先感谢您提供的任何帮助！

Answer 1

安德鲁（Andrew）的评论正是我所需要的（对此我深表谢意），但我自己听不见好话。

我的问题的解决方案是如果有人读过这篇文章，则采用多索引！

熊猫数据框：如何定义几列属性？

1 个答案: