试图在独立因素的基础上预测电影的imdbRating

时间:2018-03-26 00:12:39

标签: python-3.x machine-learning

我是机器学习的新手,拥有imdb电影数据集,并试图预测“imdbRating”'基于因素的电影: - 'ratingCount''nrOfWins''nrOfNominations''nrOfPhotos''nrOfNewsArticles''nrOfUserReviews''nrOfGenre'

我最简单的python代码是code-python

我用过我的代码'支持向量回归'机器学习算法。我只是想知道我的方法是否在python代码中显示是否正确和有效,如果这种方法是正确的,那么我可以使用其他回归算法,如RandomForestRegressionDecisionTreeRegression来预测{ {1}}使用相同的简单代码方式。

如果我的方法是错误的,那么是因为我有多个独立变量而我应该只使用一个自变量来预测“imdbRating”'这是我的因变量。

'imdbRatings'

输出:X = df[['ratingCount', 'nrOfWins', 'nrOfNominations','nrOfPhotos','nrOfNewsArticles', 'nrOfUserReviews', 'nrOfGenre']][0:100].values y = df['imdbRating'][0:100].values from sklearn.svm import SVR regressor = SVR() regressor.fit(X, y) regressor.predict([[40550, 1, 0, 19, 96.0, 85.0, 3.0]])

1 个答案:

答案 0 :(得分:0)

查看您的代码和数据集,您需要更多来自IMDb的数据才能实现这一目标。支持向量回归算法将无法基于6个示例来解释和预测。您可能需要数百个具有不同评级的示例,这些示例非常不同。祝你的项目好运!