我有一个数据框(所有列都是数字),其中包含很多列。
我编写了一个函数来对数据集执行PCA()
,然后可视化它们。 colormap
是一个外部向量。
def scatter_plot (df_numeric, colormap):
my_pca = PCA()
X_embedded = my_pca .fit_transform(df_numeric)
trace1 = go.Scatter(
x = X_embedded[:, 0],
y = X_embedded[:, 1],
mode='markers',
marker=dict(
size=16,
color = colormap, #set color equal to a variable
colorscale='Rainbow',
showscale=True
)
)
data = [trace1]
pyo.iplot(data)
现在,当我将鼠标悬停在某个点上时,它将显示PCA值。
我想自动显示数据帧上原始点的完整信息,而不是PCA值,因为存在多个不同的数据帧,并且它们具有不同的列名。
因此,当我将鼠标悬停在基于PCA的值的图形上的某个点上时,如果可以显示列名的完整列表和原始点的相应值,那将是理想的选择。
能给我一些提示吗?
非常感谢,