我是R的新手,希望就以下问题提供帮助。我目前有2位患者,每位患者2种治疗方法。我想看看仅在一个治疗组中有什么独特的基因序列,然后比较相同的治疗方法以查看两个患者中是否出现相同的基因。我能够为每个患者分离出一个治疗组中存在的基因,但是,我在第二部分遇到了麻烦,在第二部分中,我想查看两个患者中是否存在相同的序列。这是我的代码:
a=!is.na(merged11$AS1_ITD_cloneCount)
b=is.na(merged11$AS1_WT_cloneCount)
merged2<-merge(merged1,AS3_WT,by.x="clonalSequence",by.y="clonalSequence",all=T)
Patient_1_Difference <- merged2[a&b, c("clonalSequence","AS1_ITD_cloneCount","AS1_WT_cloneCount","aaSeqCDR3.x","aaSeqCDR3.y")]
P3a=!is.na(Patient_3_merge$AS3_ITD_cloneCount)
P3b=is.na(Patient_3_merge$AS3_WT_cloneCount)
Patient_3_merge <- merge(AS3_WT,AS3_ITD,by.x="clonalSequence",by.y="clonalSequence",all=T)
Patient_1_and_3_ITD_merge <- merge(merged2, Patient_3_merge, by.x="clonalSequence",by.y="clonalSequence",all=T)
Patient_1_and_3_ITD <- Patient_1_and_3_ITD_merge[a&b&P3a&P3b, c("clonalSequence","AS1_ITD_cloneCount","AS3_ITD_cloneCount","aaSeqCDR3.x.x","aaSeqCDR3.y.y")]
答案 0 :(得分:0)
您可以找到每个序列的频率。函数table()
计算频率。我使用data.table将数据放在数据框中,以使其更易于查看。我希望这能回答您的问题。
library(data.table)
x <- as.data.table(table(yourdata))