如何知道.ped文件中每个SNP的不同类型的警报

时间:2019-03-14 14:15:29

标签: r

我有一个.ped文件,每个列中的每个SNP都有不同的别名。

Flori JG05001 0 0 0 -9 T C A A T C C T T T C T G G A A G G C C C C C G G G G A A

Flori JG05002 0 0 0 -9 C C A A C C T T T T C T G G G A G A T C A C G G G G A A

Flori JG05002 0 0 0 -9 C C A A C C T C T T C T G G G A G A T C A C G G G G A A

Flori JG05002 0 0 0 -9 C C A A C C T C T T C T G G G A G A T C A C G G G G G T

我想为每列知道不同类型的alelles可能性,即对于第7列,我将仅拥有T和C可能性。

谢谢

1 个答案:

答案 0 :(得分:1)

假设文件已加载到名为df的data.frame中,则只需sapply unique

sapply(df, unique)

这将为您提供一个列表,其中每个元素都是该列中出现的所有警报的向量。