R中的数据框同时按多列排序

时间:2014-08-02 23:50:16

标签: r sorting dataframe

所以,我有一个大数据框(7000行),其排列方式如下:

head(mx)

                        Stem Progenitor   Astrocyte   Neuron genename
ENSRNOG00000000007 0.0517698   0.700234  0.11753300 4.591050     Gad1
ENSRNOG00000000010 0.0536043   0.471518  0.00741803 2.280760    Cbln1
ENSRNOG00000000012 0.0163017   0.285178  1.89533000 0.268405    Tcf15
ENSRNOG00000000024 2.7904200   0.703727 13.96940000 4.944650    HEBP1
ENSRNOG00000000028 2.5059900   2.563040  4.83952000 0.840013     Nde1
ENSRNOG00000000029 1.6204500   2.928300 15.58360000 1.750350    Myh11

我需要对此数据框进行排序,使其在前四列中按任何值从高到低排序。因此,对于该示例,这5行的排序将是:

                        Stem Progenitor   Astrocyte   Neuron genename
ENSRNOG00000000029 1.6204500   2.928300 15.58360000 1.750350    Myh11
ENSRNOG00000000024 2.7904200   0.703727 13.96940000 4.944650    HEBP1
ENSRNOG00000000028 2.5059900   2.563040  4.83952000 0.840013     Nde1
ENSRNOG00000000007 0.0517698   0.700234  0.11753300 4.591050     Gad1
ENSRNOG00000000010 0.0536043   0.471518  0.00741803 2.280760    Cbln1
ENSRNOG00000000012 0.0163017   0.285178  1.89533000 0.268405    Tcf15

我知道我可以使用如下命令一次按一列对数据框进行排序:

mx <- mx[with(mx, order(-Stem, -Progenitor, -Astrocyte, -Neuron)),]

但是,在上面的例子中,这将把Tcf15置于Gad1和Cbln1之上。有没有办法按四列中的任何一列中的最高值排序?我可以通过手动迭代数据框并使用Rbind排序到一个新的数据框来编写一些脚本,但这非常低效,我确信有更好的方法。

2 个答案:

答案 0 :(得分:6)

使用pmax

订购四列中的最大列
mx <- mx[with(mx, order(-pmax(Stem, Progenitor, Astrocyte, Neuron))),]

答案 1 :(得分:2)

使用dplyr,这是:

library(dplyr)
arrange(ms, desc(pmax(Stem, Progenitor, Astrocyte, Neuron)))