我正在尝试绘制变量Vs SalePrice数据。我尝试了pd.scatter_matrix
,但是我得到了各种组合形式的不必要的绘图。我在Y轴上寻找SalePrice,并从数据集中寻找每个元素的散点图。这是我尝试的代码。
data_prep_num['Sales_test_data']=data_sales_price_old
att=['Sales_test_data','YearBuilt','LotArea','MSSubClass','BsmtFinSF1','TotalBsmtSF','1stFlrSF','2ndFlrSF','GrLivArea','GarageArea']
pd.scatter_matrix(data_prep_num[att],alpha=.4,figsize=(30,30))```
答案 0 :(得分:0)
如果您想使用pd.plotting.scatter_matrix
但只希望其中一行(即Sales_test_data
列),则可以遍历绘图轴,并隐藏不需要的组合。
假设SalePrice
是第一列(索引0):
import numpy as np
import matplotlib.pyplot as plt
axes = pd.plotting.scatter_matrix(data_prep_num[att], alpha=0.4, figsize=(30,30))
for i in range(np.shape(axes)[0]):
if i != 0:
for j in range(np.shape(axes)[1]):
axes[i,j].set_visible(False)
注意:当您开始有很多列时,这显然不是超级有效。