我是python的新手。我想从所有列中找到重复行元素的最大值(即5到4100),并在输出中显示其行和列索引标签。最大值应为绝对值。 (与+或-无关) 行索引组将继续重复'n'次。对于行索引的每个“第n个”组,我想要每个组的最大值及其索引位置。 例如:如果组行索引重复“ n”次,则输出应显示“ n”个值。
在我的数据集中,行索引5,10,12,101,4100以相同的顺序重复两次。所以我的输出必须显示2个最大值(每组1个)。 如果我的行索引(5,10,12,101,4100)以相同的顺序重复'n'次,则Output必须显示'n'值。(每组行1个值)
df = pd.DataFrame({'E_at_0': [43, -53, 45, -17, 45, 19, 11, 32, 36, 32],
'E_at_10': [-47, 47, 46, -18, 53, 16, 12, 34, -71, -34],
'E_at_20': [56, 43, 41, 29, 36, 14, 13, -37, 43, 38],
'E_at_30': [-46, 16, -40, 31, 42, 15, 63, -39, 52, 39]}, index=[5, 10, 12, 101, 4100, 5, 10, 12, 101, 4100])
df.index.name='Ele_Num'
df = pd.read_csv ('trial.csv')
df = df.set_index('Ele_Num')
s = df.abs().stack()
mask = s == s.max()
df1 = df.stack()[mask].reset_index()
df1.columns = ['Element No','Column','Values']
print (df1)
df1.to_csv('trial_output.csv', encoding='utf-8', index=True)
预期结果:
对于第一组行(即对于索引5,10,12,101,4100)
Ele_Num E_at_20
5 56
对于第二组行索引值(即再次针对索引5,10,12,101,4100)
Ele_Num E_at_10
101 -71
实际结果:
Ele_Num E_at_30
101 -71
答案 0 :(得分:2)
您可以创建组,然后按组调用函数-最后使用loc
通过索引在输出DataFrame中进行选择:
def f(x):
x1 = x.abs().stack()
x2 = x.stack()
x = x2.iloc[np.argsort(-x1)].head(2)
return x
groups = (df.index == 5).cumsum()
df1 = df.groupby(groups).apply(f).reset_index(level=[1,2])
df1.columns = ['Element No','Column','Values']
print (df1)
Element No Column Values
1 5 E_at_20 56
1 10 E_at_0 -53
2 101 E_at_10 -71
2 10 E_at_30 63
print (df1.loc[1])
Element No Column Values
1 5 E_at_20 56
1 10 E_at_0 -53
print (df1.loc[2])
Element No Column Values
2 101 E_at_10 -71
2 10 E_at_30 63