如何在现有空列下为相同ID添加重复值

时间:2018-02-09 21:12:33

标签: python python-2.7 pandas pandas-groupby

我有一个由1000个分组数据组成的大型数据集,我正在尝试对每个组进行线性回归并找到6个不同参数的值。由于它是一个大型数据集,因此我只与一个小组合作开始。

我将其作为pandas数据帧读取,并制作了仅包含一个组的子集数据。

#EXTRACTING STARTING PARAMETER VALUES for just 1 group
a = code to calculate parameter & returns a singular number...
b = ...
c = ...
d = ...
e = ...
f = ...

我发现了它的参数并添加了6个新列来存储值。 我用过:

df = df.assign(log_B0=a, E=b, Eh=c, El=d, Th=e, Tl=f) 

创建新列,同时存储在该特定组的列中重复的值。

我使用循环来计算每个组的参数:

for i, g in df.groupby('uniqueID'):

但是我无法将每个组的输出参数值附加到原始数据帧。

我想我需要使用:

g.assign(log_B0=...)

..将每个组的参数值附加到列。 但是这只保存了最后一组,我也不想继续添加新的列标题。

我需要增加吗?

我希望输出如下:

parameter values log_B0, E..etc for the two groups 1 and 2

0 个答案:

没有答案