计数寡核苷酸和反向互补

时间:2015-07-28 19:28:28

标签: r

我开始使用R,如果可能,我需要一些帮助。我需要读取fasta文件,并计算每个物种的频率,每个核苷酸,二核苷酸和长度为10的单词以及反向互补的频率。我正在使用Biostrings包。你能帮助我吗?谢谢

1 个答案:

答案 0 :(得分:0)

Bioconductor Biostring Manual包含一些非常符合您要求的描述性方法。他们还附上了一些例子。否则,您可以只读入FASTA文件并跟踪每个基数的数量(如果您无法找出BioString程序)。

对于频率,只需reading from a text file (FASTA after removing name sequences)即可。只要你计算每个寡核苷酸出现的数量。

我不确定你想要测量多少反向互补,如果你把数组大小为10的所有可能性放在一个阵列不会太大(我认为4 ^ 10?),因此,如果以逻辑方式将数据添加到数组中,您可以非常轻松地以算法方式对它们进行比较。