基于Python中的列相似性对数据帧进行分组

时间:2017-01-25 23:26:55

标签: python pandas indexing dataframe grouping

我的数据框在列名称组中具有共同点:

  

Sample1.Feature1 | Sample1.Feature2 | ...... | Sample99.Feature1 | Sample99.Feature 2

我想将此重新排序为

  

| Sample1 ......................... | Sample99

     

|功能1,功能2 | ..... |特征1,特征2 |

然后我会有摘要统计信息,例如对于Feature1,Feature2,按Sample#分组。到目前为止,我玩df.groupby()并没有运气。

我希望我缺乏表格格式技能不会分散注意力。

提前致谢。

1 个答案:

答案 0 :(得分:2)

考虑数据框df

df = pd.DataFrame(
    np.ones((1, 6)),
    columns='s1.f1 s1.f2 s1.f3 s2.f1 s2.f2 s2.f3'.split())
df

enter image description here

  • split
df.columns = df.columns.str.split('.', expand=True)
df

enter image description here