在熊猫中基于分组依据的数据框修改

时间:2019-12-24 12:11:15

标签: python pandas

我有一个带有以下几列的数据框: Folder_Number File_Name Val_Indices Final_Result Val_Indices Final_Result 可以取值:0、1或2

样本数据

@RunWith(JUnit4.class)
@PrepareForTest({SomeXService.class})

我希望按 Folder_Number 分组数据,并且与该 Folder_Number 相对应的所有行的 Final_Result 值应为该小组。

例如,与+---------------+-----------+-------------+--------------+ | Folder_Number | File_Name | Val_Indices | Final_Result | +===============+===========+=============+==============+ | 100 | ABC.png | 0 | 1 | +---------------+-----------+-------------+--------------+ | 100 | DEF.png | 0 | 0 | +---------------+-----------+-------------+--------------+ | 100 | EFG.png | 0 | 1 | +---------------+-----------+-------------+--------------+ | 200 | HIJ.png | 1 | 0 | +---------------+-----------+-------------+--------------+ | 200 | KLM.png | 1 | 1 | +---------------+-----------+-------------+--------------+ | 300 | NOP.png | 2 | 2 | +---------------+-----------+-------------+--------------+ 相对应,我希望文件夹编号100的所有行都具有Folder_Number = 100(最小值为1,0,1)。

类似地,对应于文件夹编号200,所有行都应具有Final_Result = 0(最小值为0和1)。

对应于文件夹编号300,所有行应具有Final_Result = 0(文件夹300仅具有1个Final_Result = 2值)

1 个答案:

答案 0 :(得分:0)

你可以

df['Final_Result'] = df.groupby('Folder_Number')['Val_Indices'].transform(min)