使用Pandas来表示2D数据系列 - 使用什么结构?

时间:2016-11-02 01:15:37

标签: python pandas numpy multidimensional-array

我正在分析足部压力,每个读数是52x44矩阵,完整捕获是这些2D读数的时间序列。

这很容易用Numpy形状阵列(52x44xN)表示,N取决于采样率和捕获持续时间。使用Numpy,我已经可以执行我需要的所有操作(主要是切片和简单的描述性统计)。

我有兴趣探索Pandas的功能,但我想知道什么是合适的列名和结构。

使用Numpy 3D数组,我有索引I,J和N.如果我使用N作为Pandas DataFrame的索引,我将使用什么作为数据列?我会发现奇怪的是使用I,J和V(值)作为列,因为这将创建显式(和冗余)索引值,实际上使用(3 x(52 * 44 * N))形状矩阵。

现在,如果我将数组作为列值,3D切片(“框”选择)将会出现问题,不是吗?

(编辑)我见过一些关于MultiIndex的内容,但我不确定如何使用它。

你有什么建议?

1 个答案:

答案 0 :(得分:1)

也许尝试将Pandas Panel用于三维数据。

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Panel.html

对于其他人的参考,您可以在此处找到有关1D(Series),2D(Dataframe)和3D(Panel)Pandas结构的信息:

http://pandas.pydata.org/pandas-docs/stable/dsintro.html