按熊猫排序堆叠数据框

时间:2018-12-20 18:28:43

标签: python pandas

我已经从堆叠的数据框中生成了一个txt文件,其输出如下所示:

gcc -Wall -Wstrict-prototypes -Werror trevor.c

每个样本显示5次,等级为0-4,0为最佳,4为最差,然后将txt放入下一个函数中并计算频率,因此更新后的表格具有频率计算功能分配给它:

Name    Rank    F   R
Sample1 0   CGGGGT  GGGTTC
Sample1 1   GCTGC   GCTGCGT
Sample1 2   ACGTG   AGCTGA
Sample1 3   CGATCG  AGCTAGC
Sample1 4   CGTCAG  GGCTTT
Sample2 0   AGTCAG  GTCAG
Sample2 1   CGATCA  GCATGCA
Sample2 2   ACTAG   GCATGCA
Sample2 3   ACTAGCA ACACCA
Sample2 4   ACTGTCG CCCAAAT
Sample3 0   GGCAT   TTACTA
Sample3 1   GTCATG  GCTTTA
Sample3 2   GTCAG   TCGTAGC
Sample3 3   GCATGCA GCATGCA
Sample3 4   GTCAG   AATCTC

我想降低排名,并按从最低到最高的频率对每个Name Rank F R Frequency Sample1 0 CGGGGT GGGTTC 5 Sample1 1 GCTGC GCTGCGT 8 Sample1 2 ACGTG AGCTGA 2 Sample1 3 CGATCG AGCTAGC 1 Sample1 4 CGTCAG GGCTTT 2 Sample2 0 AGTCAG GTCAG 10 Sample2 1 CGATCA GCATGCA 5 Sample2 2 ACTAG GCATGCA 3 Sample2 3 ACTAGCA ACACCA 4 Sample2 4 ACTGTCG CCCAAAT 1 Sample3 0 GGCAT TTACTA 0 Sample3 1 GTCATG GCTTTA 0 Sample3 2 GTCAG TCGTAGC 2 Sample3 3 GCATGCA GCATGCA 3 Sample3 4 GTCAG AATCTC 4 组进行排序。对我来说,这很简单,只是我想将样本分组在一起。

我尝试了以下操作:

Name

但是我得到一个错误:

df = df.drop('Rank', axis=1)

df.groupby('Name').sort_values('Frequency')

我希望生成的DF看起来像:

AttributeError: Cannot access callable attribute 'sort_values' of 'DataFrameGroupBy' objects, try using the 'apply' method 

谢谢。

0 个答案:

没有答案