测试和评估完成后,如何将模型应用于新数据

时间:2019-03-31 15:25:40

标签: python pandas logistic-regression

我在数据集上使用了逻辑回归模型来预测标签。我训练了70%的数据,并对其余30%进行了测试。我现在有了带有未知标签的新数据,并想将我的模型应用于该数据以进行预测,但是我不确定如何做到这一点。而且我需要将新的预测标签导出/保存到csv文件或Excel文件中。有谁知道该怎么做?

我导入了缺少标签列的新数据。我尝试将标签列添加到数据并将模型指向该列,但失败了,因为我只知道如何拆分数据以进行训练和测试,但我不知道如何对要添加的看不见的数据进行100%的预测

test = pd.read_csv('test.csv')
Gender = pd.get_dummies(test['Gender'],drop_first=True)
MaritalStatus = pd.get_dummies(test['MaritalStatus'],drop_first=True)
Occupation = pd.get_dummies(test['Occupation'],drop_first=True)
Education = pd.get_dummies(test['Education'],drop_first=True)

test.drop(['FirstName', 'LastName','CountryRegionName', 'PostalCode', 'PhoneNumber',
 'BirthDate','Gender','MaritalStatus','Occupation','Education','BirthDate'],axis=1,inplace=True)

test = pd.concat([test,Gender,MaritalStatus,Occupation,Education],axis=1)

我希望测试文件包含标签列,并能够将其发送到excel或csv文件中

0 个答案:

没有答案