组名称和平均值对应值(熊猫)

时间:2018-03-14 01:30:30

标签: python-3.x pandas

数据存储在csv文件中。我使用pd.read_csv将数据从csv加载到python中。我正在寻找一种方法来对空格前具有相同名字的名称进行分组,然后使用pandas对Score1和Score2中的相应值进行求和。

std::make_unique<child_t[]>(m_capacity);

我希望将数据帧视为结果。

df = pd.DataFrame({'Names':['Jason','Jason S','Dan','Dan S'],'Score1':[30,np.nan,20,40],'Score2':[40,60,30,np.nan]})

Names         Score1    Score2
Jason         30        40
Jason S       NaN       60
Dan           20        30
Dan S         40        NaN 

到目前为止,我有以下代码,它只进行分组,没有别的。

Names         Score1     Score2
Jason         15         50
Dan           30         15

我很感激任何提示。提前谢谢。

1 个答案:

答案 0 :(得分:1)

您可以使用str.split获取群组密钥

df.fillna(0).groupby(df.Names.str.split(' ',expand=True)[0]).mean()
Out[352]: 
       Score1  Score2
0                    
Dan      30.0    15.0
Jason    15.0    50.0