分类结果显示

时间:2019-02-16 14:46:04

标签: python machine-learning scikit-learn data-visualization

我对python有点陌生。我正在使用Jupyter Notebook对一些数据进行分类。我希望我的代码显示分类结果,并显示已在数据集中分类的确切数据。我已经实现了5种机器学习算法,这是决策树的代码: 我使用的数据集具有11个功能和47个实例。我仅使用X中的2个功能,

toString()

45 0 26 1 15 0 25 1 16 0 40 0 20 1 41 1 8 1 13 0 5 0 17 0 34 0 14 0 37 0 7 1 38 1 1 0 12 0 35 1 24 1 6 1 23 1 36 1 21 0 19 1 9 1 39 1 46 0 3 0 0 0 44 0 名称:id,dtype:int64

# Load data from input file
X = df.iloc[:, 5:7] 
y = df.iloc[:,10]

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 
0, test_size = 0.3)

X_train:
array([[-0.05664779, -0.58110416],
   [ 0.42484065,  3.5857702 ],
   [-1.05270555, -0.53063454],
   [ 0.64734571,  0.67333113],
   [ 0.51518197, -0.22663851],
   [ 0.34780217, -0.29330293],
   [-1.08267179, -0.29346875],
   [ 1.22338025,  0.25858559],
   [-1.92566896,  0.60550589],
   [ 1.02700549, -0.88870573],
   [-2.19290617, -0.77885869],
   [ 0.14325145, -0.78980359],
   [ 1.86857648, -0.20176372],
   [ 0.89419424, -0.8407969 ],
   [ 0.8363162 ,  0.29999618],
   [-1.04567299,  1.65489006],
   [-1.25037945,  2.18641442],
   [ 0.69971696, -0.52016095],
   [-0.48005205, -0.49827114],
   [-0.10060947, -0.17589395],
   [ 0.02917319, -0.32619617],
   [ 1.20694636, -0.39488911],
   [-1.51508395, -0.79676853],
   [-0.22137603,  0.02061684],
   [-0.9658928 , -0.87727754],
   [-0.9286645 ,  1.24466936],
   [ 0.07129068,  0.10715181],
   [ 0.57682341,  1.13484127],
   [ 0.93138155, -0.63707242],
   [ 1.01005932, -0.76691879],
   [ 1.0114814 , -0.5027486 ],
   [-0.64643598, -0.85049806]])

  y_train:

这仅显示结果dtree = DecisionTreeClassifier() dtree.fit(X_train, y_train) predictions = dtree.predict(X_test) print(X_test) ,如下所示:

predictions

我知道ML会根据y_train做出这些预测,而y_train在此数据集中只有标签1或零。我的问题是;我如何使代码不仅显示y_train,而且显示该实例或整个“行”中的相应功能。例如。如果是1,则显示行号/等。

我真的是python新手。请帮助

1 个答案:

答案 0 :(得分:0)

如果仅查看预测和功能,则只需使用以下代码即可。

myDf=pd.concat([X_train, predictions], axis=1, sort=False)
myDf

如果没有,请详细说明问题。