因此...
我正在处理氨基酸序列。
我得到了一个包含参考序列的fasta文件和一个txt文件,给出了每个序列的分类(域,子域,昵称等等)。首先,我需要构建一个包含这些序列的树,以检查它们是否根据它们所属的类别进行分组。示例:属于域A组的序列,属于子域A1组的序列等等。
然后......我得到了一个fasta文件,其中包含来自宏基因读取的OTU代表和一个OTU计数表,声明我的20个样本中每个样本中有多少代表存在。我需要将这些OTU序列与先前构建的树对齐~AND~考虑每个样本的计数,以检查每个样本被丰富的类别。
我应该使用哪些软件?
谢谢!