我有305个序列的数据集,我使用MUSCLE软件包对它们进行了多序列比对,并创建了一个距离矩阵,然后将其用于对序列进行聚类并创建树状图。我用来执行以下操作的代码在这里:
distanceMatrix1 <- dist.dna(dnaBin.Daphnia_Sequence, model = "TN93", as.matrix = TRUE,
pairwise.deletion = TRUE)
Create a distance matrix using the alignment from muscle.
clusters.Daphnia <- IdClusters(distanceMatrix1,
method = "single",
cutoff= 0.02,
showPlot = TRUE,
type = "both",
verbose = TRUE)
我想创建一个具有彩色分支并显示序列号的树状图。上面的代码确实创建了树状图,但是它具有重叠的标签。
我尝试了另一种方法进行测试。
dend <- clusters.Dendrogram
test <- dendro_data(dend, type = "rectangle")
p <- ggplot(segment(test)) +
geom_segment(aes(x = x, y = y, xend = xend, yend = yend)) +
coord_flip() +
scale_y_reverse(expand = c(0.2, 0))
p
我得到以下树状图。我发现这在美学上令人愉悦,但它完全没有彩色的分支和序列号。
我真的很想创建一个树状图,该树状图既有彩色分支,又代表簇和序列号,因此我可以更好地分析树状图。