我正在运行Python 3.6和Pandas版本0.19.2。在下面的代码示例中,我有两个关于熊猫绘图功能scatter_matrix()
的问题:
** 1。**如何为与Label
列有关的散点图中的观测值着色?
** 2。**如何为对角线上的直方图指定箱数?我可以单独执行此操作,还是全部执行一次?
import pandas as pd
import numpy as np
N= 1000
df_feat = pd.DataFrame(np.random.randn(N, 4), columns=['A','B','C','D'])
df_label = pd.DataFrame(np.random.choice([0,1], N), columns=['Label'])
df = pd.concat([df_feat, df_label], axis=1)
axes = pd.tools.plotting.scatter_matrix(df, alpha=0.2)
这链接到this more general。
答案 0 :(得分:2)
要回答您的第一个问题,可能有一种不太“笨拙”的方式,但是
scatter_matrix(df,c=['r' if i == 1 else 'b' for i in df['Label']])
回答第二个问题:
散点矩阵可以使用pd.hist() api来使用字典中传递的hist关键字
scatter_matrix(df,hist_kwds={'bins':5})