我正处于使用Python的机器学习的最开始,我创建了一个大约有2k个实例的数据集。这些数据是游戏数据,但它只是一个愚蠢的游戏,我在几个小时内创建,用它的数据进行预测。我会给你们一些实例来了解我的数据集是怎样的。 游戏很漂亮我正在创建一个0到2000之间的位置和1到10的数字。这些是随机的东西,我认为如果我知道最后的数字和当前数字,也许我可以预测下一个标签。
但我的准确性非常糟糕(见下文):
mean() Std()
LogisticRegression: 0.480933 (0.035875)
MLPClassifier: 0.441474 (0.029023)
LinearDiscriminantAnalysis: 0.481954 (0.035140)
QuadraticDiscriminantAnalysis: 0.487177 (0.026079)
KNeighborsClassifier: 0.450221 (0.022375)
DecisionTreeClassifier: 0.421849 (0.028847)
GaussianNB: 0.488129 (0.030311)
RandomForrest: 0.469209 (0.029449)
AdaBoostClassifier: 0.458311 (0.039868)
数据集剪辑:还有last_number,但它不适合页面,所以我删除它但它就在那里。
last_number last_pos current_number current_pos Label
2 0.0 9 320.5 1
7 320.5 10 1879.5 1
9 1879.5 7 6.5 1
10 6.5 8 170.5 0
3 170.5 4 2000.0 0
我认为分类不是方法,我应该继续努力。那么我可以用什么样的技术来处理我的数据集,我的意思是回归,神经网络或者某些东西可以帮助我解决问题:)