基本上,我有一个基因数据集,其中行是基因,列是蛋白质折叠的连续时间点。我需要一个函数来从整个数据集中的其他阈值中过滤某个阈值的基因,而不仅仅是某些向量。例如:
alpha98 alpha105 alpha112 alpha119
YAL002W 0.22 0.58 -0.36 0.13
YAL003W 0.05 0.55 -0.08 0.33
任何帮助都会很棒。
答案 0 :(得分:2)
R
已向量化,R
进行了回收。这意味着,通常情况下,像myDF > threshold
这样简单的东西会让你非常接近你需要的东西。
具体来说,它会为您提供与matrix
相同维度的逻辑data.frame
,当DF中的单元格超过阈值时,TRUE
将FALSE
myDF[myDF > threshold]
} 除此以外)。
然后,您可以使用该矩阵作为工具来对data.frame进行子集化。
{{1}}