我的问题是如此笼统,以至于我敢肯定它可能是重复的,但是我找不到答案...为此,我事先表示歉意!
我有以下问题:
让我们考虑通过以下几行获得的熊猫数据集:
import numpy as np
import pandas as pd
dates = pd.date_range( '20130101', periods=6 )
df = pd.DataFrame( np.random.randn( 6, 4 ), index=dates, columns=list( 'ABCD' ) )
df2 = pd.DataFrame ( [["dog", "dog", "snake", "cat"],["mammel", "mammel", "reptilian", "mammel"]], columns=list('ABCD'))
df2 = df2.append(df)
其中给出以下结构:
A B C D
0 dog dog snake cat
1 mammel mammel reptilian mammel
2013-01-01 00:00:00 0.876641 -1.23665 0.375619 -0.642984
2013-01-02 00:00:00 -1.10135 0.264016 0.0893244 1.7381
2013-01-03 00:00:00 -0.551488 0.301711 -0.682017 1.4073
2013-01-04 00:00:00 -0.141452 -0.514909 -2.99863 -0.0283258
2013-01-05 00:00:00 -1.25555 1.1793 0.932212 -0.441398
2013-01-06 00:00:00 0.349649 -0.781957 0.0733772 0.810805
我想将与0和1对应的值作为列属性。例如,我想保留所有对应于Mammel(A,B,D)的列,但我只对对应于日期的值感兴趣。
因此,换句话说,我正在尝试找到一种通过关键字或值(在此称为属性)组合来处理原始数据集的子集的方法。
我相信在R数据帧结构中也可以做到这一点,但是我找不到最佳的pythonic / pandatic方法!
在此先感谢您提供的任何帮助!
答案 0 :(得分:0)
安德鲁(Andrew)的评论正是我所需要的(对此我深表谢意),但我自己听不见好话。
我的问题的解决方案是如果有人读过这篇文章,则采用多索引!