熊猫数据框:如何定义几列属性?

时间:2018-10-19 13:19:30

标签: python pandas dataset

我的问题是如此笼统,以至于我敢肯定它可能是重复的,但是我找不到答案...为此,我事先表示歉意!

我有以下问题:

让我们考虑通过以下几行获得的熊猫数据集:

import numpy as np
import pandas as pd

dates = pd.date_range( '20130101', periods=6 )
df = pd.DataFrame( np.random.randn( 6, 4 ), index=dates, columns=list( 'ABCD' ) )
df2 = pd.DataFrame ( [["dog", "dog", "snake", "cat"],["mammel", "mammel", "reptilian", "mammel"]], columns=list('ABCD'))
df2 = df2.append(df)

其中给出以下结构:

                            A         B          C          D
0                         dog       dog      snake        cat
1                      mammel    mammel  reptilian     mammel
2013-01-01 00:00:00  0.876641  -1.23665   0.375619  -0.642984
2013-01-02 00:00:00  -1.10135  0.264016  0.0893244     1.7381
2013-01-03 00:00:00 -0.551488  0.301711  -0.682017     1.4073
2013-01-04 00:00:00 -0.141452 -0.514909   -2.99863 -0.0283258
2013-01-05 00:00:00  -1.25555    1.1793   0.932212  -0.441398
2013-01-06 00:00:00  0.349649 -0.781957  0.0733772   0.810805

我想将与0和1对应的值作为列属性。例如,我想保留所有对应于Mammel(A,B,D)的列,但我只对对应于日期的值感兴趣。

因此,换句话说,我正在尝试找到一种通过关键字或值(在此称为属性)组合来处理原始数据集的子集的方法。

我相信在R数据帧结构中也可以做到这一点,但是我找不到最佳的pythonic / pandatic方法!

在此先感谢您提供的任何帮助!

1 个答案:

答案 0 :(得分:0)

安德鲁(Andrew)的评论正是我所需要的(对此我深表谢意),但我自己听不见好话。

我的问题的解决方案是如果有人读过这篇文章,则采用多索引!