我有一个由1000个分组数据组成的大型数据集,我正在尝试对每个组进行线性回归并找到6个不同参数的值。由于它是一个大型数据集,因此我只与一个小组合作开始。
我将其作为pandas数据帧读取,并制作了仅包含一个组的子集数据。
#EXTRACTING STARTING PARAMETER VALUES for just 1 group
a = code to calculate parameter & returns a singular number...
b = ...
c = ...
d = ...
e = ...
f = ...
我发现了它的参数并添加了6个新列来存储值。 我用过:
df = df.assign(log_B0=a, E=b, Eh=c, El=d, Th=e, Tl=f)
创建新列,同时存储在该特定组的列中重复的值。
我使用循环来计算每个组的参数:
for i, g in df.groupby('uniqueID'):
但是我无法将每个组的输出参数值附加到原始数据帧。
我想我需要使用:
g.assign(log_B0=...)
..将每个组的参数值附加到列。 但是这只保存了最后一组,我也不想继续添加新的列标题。
我需要增加吗?
我希望输出如下: