scatter_matrix并未显示所有列

时间:2018-08-31 10:58:49

标签: python pandas dataframe scatter-plot

我的scatter_matrix地块遇到了一些问题。

基本上我有一个包含19列的数据框df,即

df.columns = ['A','B',...'S']

“ A”列仅包含1到2之间的整数值。 应用于df的scatter_matrix

pd.plotting.scatter_matrix(df,diagonal = 'kde', ax = ax_values1_2)

返回所需的 19x19矩阵图

如果我将数据帧分为两个单独的数据帧df_1和df_2,它们构成相同的数据,除了df_1的所有值都位于df.A = 1和模拟df_2的值都位于df.A=2之外。

如果我现在将scatter_matrix应用于以下新数据帧:

pd.plotting.scatter_matrix(df_1,diagonal = 'kde', ax = ax_values1_2)
pd.plotting.scatter_matrix(df_2,diagonal = 'kde', ax = ax_values1_2)

我得到2个尺寸为 9x9 的指标。

所以我猜想'scatter_matrix'会将图中的行过滤掉,那里似乎没有相关的信息。我现在正确吗?

所以我的问题是:即使没有意义,如何强制scatter_matrix绘制全部19列。

对于这个问题,也许有一些理论上或简单的答案。如果没有,我还可以提供导致问题的代码。

1 个答案:

答案 0 :(得分:0)

感谢所有建议,以提高寻求帮助的质量。

与此同时,我找到了解决问题的方法。万一其他人遇到相同的问题,对我来说,解决方案是将diagonal中的scatter_matrix参数更改为hist

如果选择hist,则scatter_matrix似乎不会扔掉每列只有一个单一值的列。