以下是我的空格分隔数据的示例,总共有796行:
Locus GSL Barents Ireland
1 cgpGmo-S1001 0.25805 0.00339 0.02252
2 cgpGmo-S1006 0.11041 0.04298 0.06036
3 cgpGmo-S1007 0.24085 0.08937 0.03964
4 cgpGmo-S1008 0.07428 0.10824 0.01802
5 cgpGmo-S1009 0.08524 0.01471 0.00000
6 cgpGmo-S1013 0.03547 0.05091 0.00991
我想要做的是隔离顶部四分位数(三个类别中的每个类别为25%,然后绘制一个维恩图,显示位于前25%的1,2(1)的位点(行)数量,或所有三个类别。
我很确定我可以使用包维恩图来创建图表,但我不确定如何生成位于每个类别前25%的基因座列表,以用作维恩的对象。
答案 0 :(得分:0)
一个简单的案例 - 排序并获得最低的25%:
a <- seq (100,1,-1)
b <- seq (100,1,-1)
d <- data.frame(cbind(col1=a, col2=b))
sort(d$col1)[1:(length(d$col1)/4)]
将排序并给出25%的最低值。
(或者为了避免排序[可能是内存密集型],然后使用order
:
d$col1[order(d$col1)][1:(length(d$col1)/4)]
)