我想知道是否有一种使用perl或python的方法从MSA中删除仅有空格的列-和/或N和/或? (除核苷酸外的所有内容)。它将在多个MSA上运行。
seq1
ATCGNN-?? ATCG
seq2
ATCGNN--ATCGCG
seq3
ATCG-?NCGAAAAA
(删除第5、6、7列)
我知道有一些工具,例如TrimAl,可以选择删除空白位置,但是我不知道我是否可以使其适应于仅包含字符“-”,“ N”,“?”的位置。我想在对齐的其他部分保留?,N,-,所以我认为tr命令不能帮上忙吗?
谢谢