我为一个数据集(约500行)编写了一个MLP,该数据集包含一个生物的长度(L)和宽度(W)以及生物量的输出(生物的重量,以磅为单位,B)。
mlp = MLPRegressor((5, 5), max_iter=1000)
我已经用功能训练了模型
# Model 1
# Input = Feature 1: Length, Feature 2: Width. Output = Biomass
df = {'length': [60.1, 59.2, 59.4, 58.5], 'width': [15.4, 16.2, 14.9, 15.7], 'weight': [8.34, 7,65, 7.89, 7.14]}
# Model 2
# Input = Feature 1: Length * Width^2. Output = Biomass
df = {'length*height^2': [60.1, 59.2, 59.4, 58.5], 'weight': [14253.31, 15536.44, 13187.39, 14419.66]}
我的模型具有一个特征的整体准确度超过95%,但是分离特征的准确度约为85%。
我对MLP的理解是模型1应该比模型2更好,因为它基本上可以找到长度和高度与生物质的最佳组合,但是我的1特征模型的性能要好得多。我也尝试使用没有运气的缩放器来标准化数据集。
scaler = StandardScaler()