合并数据框和字符串

时间:2017-11-10 01:35:46

标签: python string dataframe mean

我正在尝试使用数据框重新组合不同类型的数据。

我有一个包含3列的数据框:

  • 我定义的一个和索引(使用groupby命令)
  • 重新组合一个参数的一个,比如'valeur1',我希望这些参数具有相同的索引(在分组后使用一个卑鄙的命令)
  • 最后一列包含字符串。每个索引只有一个字符串,但有些单元格可能包含nan。

我试图最终得到一个数据帧,其中包含1个参数的均值,具体取决于索引以及与索引一起使用的字符串(字符串列中的nan并不重要)。这是一张带有示例或我想要获得的图片:illustration。主要问题是dataframe.mean不适用于字符串

到目前为止我使用的代码非常基本:

dataRaw=pd.read_csv('file.csv', sep=';', encoding='latin-1')
data=dataRaw.groupby(index)
databis=data.mean();

任何建议都将不胜感激。

谢谢!

1 个答案:

答案 0 :(得分:0)

我认为您需要按多列分组:

databis = dataRaw.groupby(['index', 'String']).mean()