数据存储在csv文件中。我使用pd.read_csv将数据从csv加载到python中。我正在寻找一种方法来对空格前具有相同名字的名称进行分组,然后使用pandas对Score1和Score2中的相应值进行求和。
std::make_unique<child_t[]>(m_capacity);
我希望将数据帧视为结果。
df = pd.DataFrame({'Names':['Jason','Jason S','Dan','Dan S'],'Score1':[30,np.nan,20,40],'Score2':[40,60,30,np.nan]})
Names Score1 Score2
Jason 30 40
Jason S NaN 60
Dan 20 30
Dan S 40 NaN
到目前为止,我有以下代码,它只进行分组,没有别的。
Names Score1 Score2
Jason 15 50
Dan 30 15
我很感激任何提示。提前谢谢。
答案 0 :(得分:1)
您可以使用str.split
获取群组密钥
df.fillna(0).groupby(df.Names.str.split(' ',expand=True)[0]).mean()
Out[352]:
Score1 Score2
0
Dan 30.0 15.0
Jason 15.0 50.0