我在数据集上使用了逻辑回归模型来预测标签。我训练了70%的数据,并对其余30%进行了测试。我现在有了带有未知标签的新数据,并想将我的模型应用于该数据以进行预测,但是我不确定如何做到这一点。而且我需要将新的预测标签导出/保存到csv文件或Excel文件中。有谁知道该怎么做?
我导入了缺少标签列的新数据。我尝试将标签列添加到数据并将模型指向该列,但失败了,因为我只知道如何拆分数据以进行训练和测试,但我不知道如何对要添加的看不见的数据进行100%的预测
test = pd.read_csv('test.csv')
Gender = pd.get_dummies(test['Gender'],drop_first=True)
MaritalStatus = pd.get_dummies(test['MaritalStatus'],drop_first=True)
Occupation = pd.get_dummies(test['Occupation'],drop_first=True)
Education = pd.get_dummies(test['Education'],drop_first=True)
test.drop(['FirstName', 'LastName','CountryRegionName', 'PostalCode', 'PhoneNumber',
'BirthDate','Gender','MaritalStatus','Occupation','Education','BirthDate'],axis=1,inplace=True)
test = pd.concat([test,Gender,MaritalStatus,Occupation,Education],axis=1)
我希望测试文件包含标签列,并能够将其发送到excel或csv文件中