import numpy as np
from sklearn.tree import DecisionTreeClassifier as DTS
from sklearn.cross_validation import train_test_split as tts
np.random.seed(0)
a = np.random.randint(20,size=1000).reshape(200,5)
b = []
for i in a:
if i[2] == 5:
b.append(1)
else:
b.append(0)
b = np.array(b).reshape(200,1)
t1,t2,y1,y2 = tts(a,b)
l = DTS()
l.fit(t1,y1)
print(l.score(t2,y2))
随机生成五个功能。如果第三列(中间列)的值为5,则输出为1,否则为0.我测试了DecisionTreeClassifier,它似乎有效。我也做了一些预测,似乎有效。现在我的问题是:如何获得解决方案的算法?让我们假设这是真实的数据,我不知道输入如何与输出相关,但是DecisionTreeClassifier可以在这个数据集上工作。感谢