使用新数据测试训练的ML模型 - 如何处理one_hot_encoding?

时间:2017-06-28 10:15:35

标签: python machine-learning deep-learning

我在以下数据集上训练了DNN模型:

hash       name  surname  datetime             total  nb_success  result 
axBBdnn78  aaa   bbb      2016-01-01 00:01:26  50.00   1           OK

我的目标是预测result列的价值。

我one_hot编码了所有的字符串值,这给了我很多功能,然后训练和保存我的模型。

我现在想在新数据集上测试它(只有一个条目)。我首先将行加载到DataFrame中:

food = np.array(['xxxsBF44', 'feature_name', 'feature_surname', 'feature_datetime', 'feature_total', 'feature_nb_success', 'feature_result'])
food = np.reshape(food, (1, 7))
data = pd.DataFrame(food, columns=names)
data['amount'] = data['amount'].astype(float) 

现在,我当然需要准备这些数据,正如我在训练DNN时所做的那样。但是one_hot编码字符串功能没有意义,因为它只包含一行。 one_encoding的结果类似于:

hash       name  surname  datetime  total  nb_success  result 
0          0     1.0      1.0       50.00  1           1

因此,将使用无意义数据进行预测。

我的问题是如何使用我保存的模型进行预测,以及如何仅在一行上处理无意义的one_hot编码?

0 个答案:

没有答案