如何在python中用真实数据测试机器学习模型

时间:2017-12-03 20:14:55

标签: python machine-learning

我是机器学习用品和python的新手。我在python中创建了一个简单的线性回归模型。我可以测试我的模型的准确性,但仅针对我的数据集中的数据,我的数据集是一个csv文件,其中包含薪水和多年经验之间的关系。但我想在实际生活中使用它。就像我将输入多年的经验和输出将预测薪水。这是我到目前为止所做的事情

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# Importing the dataset
dataset = pd.read_csv('Salary_Data.csv')
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 1].values

# Splitting the dataset into the Training set and Test set
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 1/3, random_state = 0)

# Feature Scaling
"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)
sc_y = StandardScaler()
y_train = sc_y.fit_transform(y_train)"""

# Fitting Simple Linear Regression to the Training set
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)

# Predicting the Test set results
y_pred = regressor.predict(X_test)

我想用这样的方式修改上面的代码,我可以给输入多年的经验和输出预期的工资。

提前致谢。

2 个答案:

答案 0 :(得分:2)

训练模型后,将模型保存到文件并稍后加载以进行预测。在Python中,您可以使用'pickle'来实现这一目标。

参考文献:

scikit-learn Model Persistence

save and load machine learning models, an example

答案 1 :(得分:1)

您可以使用训练有素的模型进行预测。   如前所述,您可以使用

regressor.predict([years_of_xp])

考虑到多年的经验,这将要求您的模型预测有人会收到的工资。

相关问题