我有两个数据框:一个(df)包含20个基因名称和一些相应的值,另一个(df1)包含20000行和2列,并且在每个df1的行中都有基因名称(每个基因重复1000次,因此为20 * 1000行)及其对应的值。
df
ENSG00000117616 -1.13417965529049
ENSG00000187010 -0.518520357346421
ENSG00000197888 -1.04398184631892 .....
df1
ENSG00000117616 -1.2303949705498
ENSG00000117616.1 -0.689888775658402
ENSG00000117616.2 -1.13417965529049
ENSG00000117616.3 -0.121184859801036
ENSG00000117616.4 -0.689888775658402 ......
我想比较两个数据帧。对于df1中的每个基因,多少时间数据大于或小于df基因值?我想循环播放。
code:
for(i in df$value){
up <- (nrow(df1[df1$value > i, ]))
down <- (nrow(df1[df1$value < i, ]))
}
此代码用于计算仅在特定基因行中要计算的所有数据中具有上下值的行数。