美好的一天,
我已将lightGBM算法应用于房地产价格数据集(85524个观测值和167个特征)。我想接收年份和房地产面积大小到价格之间的交互作用。因变量用log1p转换以获得正态分布。
我已经使用Python pdpbox模块生成了一个交互图。据我了解,着色是变量之间的平均价格,但是,我希望收到交互的间隔,即最小和最大。有可能这样做吗?
LGBMR.fit(df_train.drop(["Price"], axis = 1, inplace = False), df_train["Price"])
feats = ['Year', 'Real estate area']
p = pdp.pdp_interact(LGBMR, df, model_features = columns, features = feats)
pdp.pdp_interact_plot(p, feats, plot_type = 'grid')
我正在添加pdp交互图。例如,在2008年,购买了大小为0.52的房地产对象,平均价格为5.697(预测),但我想知道这种互动的最低和最高预测价格。