Question

我编写了一个函数，该函数从数据库接收数据，然后将其返回到列表中，然后具有以下格式：

df_master = []
#x = arbitrary data from DB
for i in db_list:
df_tmp = df_tmp.append(ReadDBValues(i, interval, start_date, end_date))
df_master.append(df_tmp)

但是，这也意味着扁平化数据有些麻烦。我使用以下方法： flat = [df_master中子列表中的项目用于子列表中的项目]

按如下所示产生[1,0,0,1]的结果，它将返回4列，但不返回每列的关联值。

我希望能够将其转换为这样的数据帧：

W | X | Y | Z ....
1 | 2 | 3 | 4 ...
  |   |   |   ....

我一直以此为参考： Making a flat list out of list of lists in Python

但是，我似乎只能将前两列压平。我能得到进一步的指导吗？

非常感谢您。

编辑：我现在已经设法为数据创建一个“唯一”索引，因此我保留了列名。但是，问题是说有两列。第一列为1400行，第二列为1400行。

代码将执行以下操作：

Date | Val X | Val Y
....   1398     NaN
....   1399     NaN
       1400     NaN
       NaN       1
       NaN       2

应改为：

Date | Val X | Val Y
....   1398     523
....   1399     242
       1400     112

有什么想法吗？

编辑：使用GroupBy索引也没有成功，并且只会显示NaN值。

(df_master.groupby(df_master.index).sum())

任何人都可以为我指出正确的方向吗？

将Python中的嵌套列表解压缩到DataFrame中（不成功）

0 个答案: