我编写了一个函数,该函数从数据库接收数据,然后将其返回到列表中,然后具有以下格式:
df_master = []
#x = arbitrary data from DB
for i in db_list:
df_tmp = df_tmp.append(ReadDBValues(i, interval, start_date, end_date))
df_master.append(df_tmp)
但是,这也意味着扁平化数据有些麻烦。 我使用以下方法: flat = [df_master中子列表中的项目用于子列表中的项目]
按如下所示产生[1,0,0,1]的结果,它将返回4列,但不返回每列的关联值。
我希望能够将其转换为这样的数据帧:
W | X | Y | Z ....
1 | 2 | 3 | 4 ...
| | | ....
我一直以此为参考: Making a flat list out of list of lists in Python
但是,我似乎只能将前两列压平。 我能得到进一步的指导吗?
非常感谢您。
编辑:我现在已经设法为数据创建一个“唯一”索引,因此我保留了列名。但是,问题是说有两列。第一列为1400行,第二列为1400行。
代码将执行以下操作:
Date | Val X | Val Y
.... 1398 NaN
.... 1399 NaN
1400 NaN
NaN 1
NaN 2
应改为:
Date | Val X | Val Y
.... 1398 523
.... 1399 242
1400 112
有什么想法吗?
编辑:使用GroupBy索引也没有成功,并且只会显示NaN值。
(df_master.groupby(df_master.index).sum())
任何人都可以为我指出正确的方向吗?