我的scatter_matrix
地块遇到了一些问题。
基本上我有一个包含19列的数据框df,即
df.columns = ['A','B',...'S']
“ A”列仅包含1到2之间的整数值。 应用于df的scatter_matrix
pd.plotting.scatter_matrix(df,diagonal = 'kde', ax = ax_values1_2)
返回所需的 19x19矩阵图。
如果我将数据帧分为两个单独的数据帧df_1和df_2,它们构成相同的数据,除了df_1的所有值都位于df.A = 1
和模拟df_2的值都位于df.A=2
之外。
如果我现在将scatter_matrix应用于以下新数据帧:
pd.plotting.scatter_matrix(df_1,diagonal = 'kde', ax = ax_values1_2)
pd.plotting.scatter_matrix(df_2,diagonal = 'kde', ax = ax_values1_2)
我得到2个尺寸为 9x9 的指标。
所以我猜想'scatter_matrix'会将图中的行过滤掉,那里似乎没有相关的信息。我现在正确吗?
所以我的问题是:即使没有意义,如何强制scatter_matrix
绘制全部19
列。
对于这个问题,也许有一些理论上或简单的答案。如果没有,我还可以提供导致问题的代码。
答案 0 :(得分:0)
感谢所有建议,以提高寻求帮助的质量。
与此同时,我找到了解决问题的方法。万一其他人遇到相同的问题,对我来说,解决方案是将diagonal
中的scatter_matrix
参数更改为hist
。
如果选择hist
,则scatter_matrix似乎不会扔掉每列只有一个单一值的列。