我知道这是非常基本的事情,我搜索了很多,但我找不到任何解决方案。
我有基因(行)和样本(col)的二元矩阵,我想根据样本中基因的存在= 1 /缺失= 0来计算样本之间的距离/相似性。我使用了一个距离矩阵dist函数,但我找不到提取距离大于0.5的样本对矩阵的方法
我有文件" data.txt"其中包含二进制数据基因(行)和样本(col),
读二进制文件
table<-read.table("data.txt",header=TRUE,row.names=1,sep="\t")
计算距离矩阵
distance<-dist(table[1:15,1:15],method="binary", upper=TRUE,diag=TRUE)
距离
x200032 x200299 x200203 x200078 x200108 x200024 x200014 x200239
x200032 0.0000000 0.1000000 0.1000000 0.1000000 0.2000000 0.1000000 0.1000000 0.1500000 x200299 0.1000000 0.0000000 0.1000000 0.1000000 0.2000000 0.1000000 0.1000000 0.1500000 x200203 0.1000000 0.1000000 0.0000000 0.1000000 0.2000000 0.1000000 0.6000000 0.1500000 x200078 0.1000000 0.5000000 0.1000000 0.0000000 0.2000000 0.1000000 0.1000000 0.1500000 x200108 0.2000000 0.2000000 0.2000000 0.2000000 0.0000000 0.2000000 0.2000000 0.1578947
我想得到距离大于0.5的样本对(图像附加在红色矩形中),作为矩阵或数据框对象,样本名称不是索引
距离
x200299 x200014
x200203 0.1000000 0.6000000
x200078 0.5000000 0.1000000
提前感谢您的回答。