我正在分析足部压力,每个读数是52x44矩阵,完整捕获是这些2D读数的时间序列。
这很容易用Numpy形状阵列(52x44xN)表示,N取决于采样率和捕获持续时间。使用Numpy,我已经可以执行我需要的所有操作(主要是切片和简单的描述性统计)。
我有兴趣探索Pandas的功能,但我想知道什么是合适的列名和结构。
使用Numpy 3D数组,我有索引I,J和N.如果我使用N作为Pandas DataFrame的索引,我将使用什么作为数据列?我会发现奇怪的是使用I,J和V(值)作为列,因为这将创建显式(和冗余)索引值,实际上使用(3 x(52 * 44 * N))形状矩阵。
现在,如果我将数组作为列值,3D切片(“框”选择)将会出现问题,不是吗?
(编辑)我见过一些关于MultiIndex的内容,但我不确定如何使用它。
你有什么建议?
答案 0 :(得分:1)
也许尝试将Pandas Panel
用于三维数据。
http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Panel.html
对于其他人的参考,您可以在此处找到有关1D(Series
),2D(Dataframe
)和3D(Panel
)Pandas结构的信息: