我有一个数据集(租金价格与卧室和社区数量)。
我想将租赁价格建模为基准价格的乘积,与卧室数量相关的标量和与邻域相关的标量。
e.g。如果在Mayfair有2张床,可能是R = 100美元* 1.2 * 1.5
数学上我想这会是这样的: 租金价格=基数*(a1B1 + a2B2 + a3B3 ......)*(k1N1 + k2N2 + ...)
其中B2是二进制变量,如果属性有2个卧室则为1,否则为0;在上面的例子中a2将是1.2; N1是二进制变量,如果属性在“邻域1”中,则为1,等等。
scikit-learn帮助建模这样的事情?我可以建模变量的线性组合:
price = a1B1 + a2B2 + ... + k1N1 + k2N2
但我看不出有任何方法可以对乘法模型进行建模,也无法将带有分类变量的乘法模型转换为线性模型。
答案 0 :(得分:2)
这是一个简单的线性回归问题。房价回归是线性回归最着名的用例。你可以导入它:
from sklearn.linear_model import LinearRegression
linear_model = LinearRegression()
linear_model.fit(X_training, y_training)
# Where X = features that you can provide in a dataframe or numpy matrix
# y = House prices
prices = linear_model.predict(X_test)
# ^Gives the prediction for the prices