假设多个样本之间的距离矩阵,我想以某种方式将这些距离合理地映射到色彩空间。因此,例如,如果您有三个表观群集,则它们应具有不同的颜色,并且在群集中,您将具有许多阴影。但是,如果可能,我想避免显式群集。
显然,映射不能是完美的和通用的:相反,它是一种启发式方法。
是否有已知的算法?或者,也许是现成的R解决方案?
答案 0 :(得分:2)
这是一种可能性。无论原始数据有多少个维度,都可以对距离矩阵使用多维缩放,以粗略地保留距离的方式将数据投影到三个维度。如果将这三个维度分别视为R,G和B,则将提供一种配色方案,其中接近的点应具有“接近”的颜色。
这是一个简单的例子。我用4个聚类生成一些5维数据(尽管没有执行聚类分析)。由此,我们得到距离矩阵。然后,如上所述,我们使用多维缩放将其转换为颜色图。绘制点以显示结果。
## Generate some sample data
set.seed(1234)
v = c(rnorm(80,0,1), rnorm(80,0,1), rnorm(80,4,1), rnorm(80,4,1))
w = c(rnorm(80,0,1), rnorm(80,4,1), rnorm(80,0,1), rnorm(80,4,1))
x = c(rnorm(80,0,1), rnorm(80,0,1), rnorm(80,4,1), rnorm(80,4,1))
y = c(rnorm(80,0,1), rnorm(80,4,1), rnorm(80,0,1), rnorm(80,4,1))
z = c(rnorm(80,0,1), rnorm(80,4,1), rnorm(80,-4,1), rnorm(80,8,1))
df = data.frame(v,w,x,y,z)
## Distance matrix
D = dist(df)
## Project to 3-dimensions
PROJ3 = cmdscale(D, 3)
## Scale the three dimensions to [0,1] interval
ScaledP3 = apply(PROJ3, 2, function(x) { (x - min(x))/(max(x)-min(x)) })
colnames(ScaledP3) = c("red", "green", "blue")
X = as.data.frame(ScaledP3)
## Convert to color map
ColorMap = do.call(rgb, X)
plot(x,y, pch=20, col=ColorMap)