我有一个带有以下行的R脚本:
KSData.dataset.abbrev = aggregate(log2FC ~ Kinase.Gene+Substrate.Gene+Substrate.Mod+Source, data=KSData.dataset.abbrev, FUN=mean)
KSData.dataset.abbrev看起来像这样:
Kinase.Gene Substrate.Gene Substrate.Mod Peptide p FC log2FC Source
364 ABL1 RBM39 Y95 YRSPYSGPK 0.019590948 1.6158045 0.692252615 PhosphoSitePlus
8 AKT1 AKT1S1 T246 LNTSDFQK 0.800879536 0.8909224 -0.166628324 PhosphoSitePlus
121 AKT1 EPHA2 S897 LPSTSGSEGVPFR 0.500658346 0.7052020 -0.503891606 PhosphoSitePlus
使用上面的代码行后,df类似于此:
Kinase.Gene Substrate.Gene Substrate.Mod Source log2FC
430 ABL1 RBM39 Y95 PhosphoSitePlus 0.6922526152
19 AKT1 PEA15 S116 PhosphoSitePlus 1.1782441053
80 AKT1 MDM2 S166 PhosphoSitePlus -0.7967537534
我不知道,这行代码有多完美... 感谢您的帮助
答案 0 :(得分:1)
我为唯一组组合计算mean
的{{1}} log2FC
,Kinase.Gene
,Substrate.Gene
和{{1 }}。
使用一个小的数据样本,您可以看到Substrate.Mod
在做什么:
Source