Question

我的数据如下：

1.00 1.00 1.00
3.23 4.23 0.33
1.23 0.13 3.44
4.55 12.3 14.1
2.00 2.00 2.00
1.21 1.11 1.11
3.55 5.44 5.22
4.11 1.00 4.00

它来自4块。块的第一行是索引，其余的是值。块总是有4行，但列数可以超过3。

例如：

1.00 1.00 1.00 <- 1st chunk, the index = 1

3.23 4.23 0.33  <- values
1.23 0.13 3.44  <- values
4.55 12.3 14.1  <- values

上面我的例子只包含2个块，但实际上它可以包含更多。

我想要做的是创建一个数据框字典，以便我可以处理它们 chunk by chunk。即来自：

In [1]: import pandas as pd

In [2]:  df = pd.read_table("http://dpaste.com/29R0BSS.txt",header=None, sep = " ")

In [3]: df
Out[3]:
      0      1      2
0  1.00   1.00   1.00
1  3.23   4.23   0.33
2  1.23   0.13   3.44
3  4.55  12.30  14.10
4  2.00   2.00   2.00
5  1.21   1.11   1.11
6  3.55   5.44   5.22
7  4.11   1.00   4.00

进入数据框列表，这样我可以做这样的事情（我这样做）：

>> # Let's call new data frame  `nd`.
>> nd[1]
>>     0      1      2
0  3.23   4.23   0.33
1  1.23   0.13   3.44
2  4.55  12.30  14.10

Answer 1

有很多方法可以做到这一点;我倾向于使用groupby，例如

之类的东西

>>> grouped = df.groupby(np.arange(len(df)) // 4)
>>> d = {v.iloc[0][0]: v.iloc[1:].reset_index(drop=True) for k,v in grouped}
>>> for k,v in d.items():
...     print(k)
...     print(v)
...     
1.0
      0      1      2
0  3.23   4.23   0.33
1  1.23   0.13   3.44
2  4.55  12.30  14.10
2.0
      0     1     2
0  1.21  1.11  1.11
1  3.55  5.44  5.22
2  4.11  1.00  4.00

将Pandas DataFrame转换为DataFrame列表

1 个答案: