ive尝试使用python在python中进行一些机器学习。我的目标是根据人们的生活方式估算他们的保险费用。我从kaggle获得了一个不错的数据库。对我的数据集进行培训和测试进行得很好,但是现在我想对一个人进行预测,而我不知道该如何开始。
我发布了到目前为止我在线性回归培训和测试中所做的事情(我还做了很多其他事情,例如蒙特卡洛,knearest等...)
结果是
训练准确度:0.735
测试仪精度:0.795
那么您如何建议继续估算其他人的保险费用?
#Linear Regression
linreg = LinearRegression()
linreg.fit(X_train, y_train)
print("Accuracy on training set: {:.3f}".format(linreg.score(X_train, y_train)))
print("Accuracy on test set: {:.3f}".format(linreg.score(X_test, y_test)))```
答案 0 :(得分:1)
由于您已经“适合”了X_train和y_train数据集的算法,因此可以按以下方式对X_test进行预测:
predictions = linreg.predict(X_test)
基本上,linreg.fit(X_train, y_train)
表示使用X_train
作为输入并使用y_train
作为(目标)标签的拟合/训练。另一方面,linreg.predict(X_test)
意味着使用X_test
作为输入来产生预测,而linreg.score(X_test, y_test)
意味着使用X_test
作为输入来进行预测,然后将预测结果与(目标){ {1}}以获得(准确性)分数。