我必须独立预测每个IP地址的网络流量中的数据包数量。我的数据集中有8个IP地址,时间窗口,isSending标志,工作日(X)和数据包数量(Y)。 我为每列准备了一个热编码。 我的目标是对给定的向量进行流量预测:IP,日期,时间窗,isSending。
我尝试使用MLPRegressor将整个数据集视为一个。现在给出错误的输出,因为它将整个数据视为一个“类”。我想分别为每个IP地址准备线性回归,但是我的数据集如此庞大,以至于无法单独拟合模型。
我的数据集中的行示例: 0; 0; 0; 0; 0; 0; 0; 0; 1; 1; 0; 0; 0; 0; 0; 0; 0; 1; 9823 在位置上包含1,对应的源IP,时间窗口ID,日期。 这是一个仅用于几个时间窗和1天测试的数据集。最后是特定时间窗口和日期从IP流出的数据包的数量。
我的输出完全不可接受,例如我期望为3并具有-134