在维恩图中使用它们创建最高25%值的子集

时间:2015-09-24 09:26:17

标签: r subset venn-diagram

以下是我的空格分隔数据的示例,总共有796行:

         Locus     GSL Barents Ireland
1 cgpGmo-S1001 0.25805 0.00339 0.02252
2 cgpGmo-S1006 0.11041 0.04298 0.06036
3 cgpGmo-S1007 0.24085 0.08937 0.03964
4 cgpGmo-S1008 0.07428 0.10824 0.01802
5 cgpGmo-S1009 0.08524 0.01471 0.00000
6 cgpGmo-S1013 0.03547 0.05091 0.00991

我想要做的是隔离顶部四分位数(三个类别中的每个类别为25%,然后绘制一个维恩图,显示位于前25%的1,2(1)的位点(行)数量,或所有三个类别。

我很确定我可以使用包维恩图来创建图表,但我不确定如何生成位于每个类别前25%的基因座列表,以用作维恩的对象。

1 个答案:

答案 0 :(得分:0)

一个简单的案例 - 排序并获得最低的25%:

a <- seq (100,1,-1)
b <- seq (100,1,-1)
d <- data.frame(cbind(col1=a, col2=b))
sort(d$col1)[1:(length(d$col1)/4)]

将排序并给出25%的最低值。

(或者为了避免排序[可能是内存密集型],然后使用order

d$col1[order(d$col1)][1:(length(d$col1)/4)]