我正在尝试使用数据框重新组合不同类型的数据。
我有一个包含3列的数据框:
我试图最终得到一个数据帧,其中包含1个参数的均值,具体取决于索引以及与索引一起使用的字符串(字符串列中的nan并不重要)。这是一张带有示例或我想要获得的图片:illustration。主要问题是dataframe.mean不适用于字符串
到目前为止我使用的代码非常基本:
dataRaw=pd.read_csv('file.csv', sep=';', encoding='latin-1')
data=dataRaw.groupby(index)
databis=data.mean();
任何建议都将不胜感激。
谢谢!
答案 0 :(得分:0)
我认为您需要按多列分组:
databis = dataRaw.groupby(['index', 'String']).mean()