我已经从堆叠的数据框中生成了一个txt文件,其输出如下所示:
gcc -Wall -Wstrict-prototypes -Werror trevor.c
每个样本显示5次,等级为0-4,0为最佳,4为最差,然后将txt放入下一个函数中并计算频率,因此更新后的表格具有频率计算功能分配给它:
Name Rank F R
Sample1 0 CGGGGT GGGTTC
Sample1 1 GCTGC GCTGCGT
Sample1 2 ACGTG AGCTGA
Sample1 3 CGATCG AGCTAGC
Sample1 4 CGTCAG GGCTTT
Sample2 0 AGTCAG GTCAG
Sample2 1 CGATCA GCATGCA
Sample2 2 ACTAG GCATGCA
Sample2 3 ACTAGCA ACACCA
Sample2 4 ACTGTCG CCCAAAT
Sample3 0 GGCAT TTACTA
Sample3 1 GTCATG GCTTTA
Sample3 2 GTCAG TCGTAGC
Sample3 3 GCATGCA GCATGCA
Sample3 4 GTCAG AATCTC
我想降低排名,并按从最低到最高的频率对每个Name Rank F R Frequency
Sample1 0 CGGGGT GGGTTC 5
Sample1 1 GCTGC GCTGCGT 8
Sample1 2 ACGTG AGCTGA 2
Sample1 3 CGATCG AGCTAGC 1
Sample1 4 CGTCAG GGCTTT 2
Sample2 0 AGTCAG GTCAG 10
Sample2 1 CGATCA GCATGCA 5
Sample2 2 ACTAG GCATGCA 3
Sample2 3 ACTAGCA ACACCA 4
Sample2 4 ACTGTCG CCCAAAT 1
Sample3 0 GGCAT TTACTA 0
Sample3 1 GTCATG GCTTTA 0
Sample3 2 GTCAG TCGTAGC 2
Sample3 3 GCATGCA GCATGCA 3
Sample3 4 GTCAG AATCTC 4
组进行排序。对我来说,这很简单,只是我想将样本分组在一起。
我尝试了以下操作:
Name
但是我得到一个错误:
df = df.drop('Rank', axis=1)
df.groupby('Name').sort_values('Frequency')
我希望生成的DF看起来像:
AttributeError: Cannot access callable attribute 'sort_values' of 'DataFrameGroupBy' objects, try using the 'apply' method
谢谢。