我有一个带有以下几列的数据框: Folder_Number , File_Name , Val_Indices 和 Final_Result 。 Val_Indices 和 Final_Result 可以取值:0、1或2
样本数据
@RunWith(JUnit4.class)
@PrepareForTest({SomeXService.class})
我希望按 Folder_Number 分组数据,并且与该 Folder_Number 相对应的所有行的 Final_Result 值应为该小组。
例如,与+---------------+-----------+-------------+--------------+
| Folder_Number | File_Name | Val_Indices | Final_Result |
+===============+===========+=============+==============+
| 100 | ABC.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 100 | DEF.png | 0 | 0 |
+---------------+-----------+-------------+--------------+
| 100 | EFG.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 200 | HIJ.png | 1 | 0 |
+---------------+-----------+-------------+--------------+
| 200 | KLM.png | 1 | 1 |
+---------------+-----------+-------------+--------------+
| 300 | NOP.png | 2 | 2 |
+---------------+-----------+-------------+--------------+
相对应,我希望文件夹编号100的所有行都具有Folder_Number = 100
(最小值为1,0,1)。
类似地,对应于文件夹编号200,所有行都应具有Final_Result = 0
(最小值为0和1)。
对应于文件夹编号300,所有行应具有Final_Result = 0
(文件夹300仅具有1个Final_Result = 2
值)
答案 0 :(得分:0)
你可以
df['Final_Result'] = df.groupby('Folder_Number')['Val_Indices'].transform(min)