我是机器学习的新手,拥有imdb电影数据集,并试图预测“imdbRating”'基于因素的电影: - 'ratingCount'
,'nrOfWins'
,'nrOfNominations'
,'nrOfPhotos'
,'nrOfNewsArticles'
,'nrOfUserReviews'
,'nrOfGenre'
我最简单的python代码是code-python。
我用过我的代码'支持向量回归'机器学习算法。我只是想知道我的方法是否在python代码中显示是否正确和有效,如果这种方法是正确的,那么我可以使用其他回归算法,如RandomForestRegression
,DecisionTreeRegression
来预测{ {1}}使用相同的简单代码方式。
如果我的方法是错误的,那么是因为我有多个独立变量而我应该只使用一个自变量来预测“imdbRating”'这是我的因变量。
'imdbRatings'
输出:X = df[['ratingCount', 'nrOfWins', 'nrOfNominations','nrOfPhotos','nrOfNewsArticles', 'nrOfUserReviews', 'nrOfGenre']][0:100].values
y = df['imdbRating'][0:100].values
from sklearn.svm import SVR
regressor = SVR()
regressor.fit(X, y)
regressor.predict([[40550, 1, 0, 19, 96.0, 85.0, 3.0]])
答案 0 :(得分:0)
查看您的代码和数据集,您需要更多来自IMDb的数据才能实现这一目标。支持向量回归算法将无法基于6个示例来解释和预测。您可能需要数百个具有不同评级的示例,这些示例非常不同。祝你的项目好运!