我正在尝试了解machine learning
,我从DecisionTree
中挑选了sklearn
作为尝试了解的第一个algo
。
X dataframe head:
d_t_375 190dt375_std190MA
0 0.224533 0.143279
1 0.542533 0.095203
2 -0.238400 0.221700
3 0.167467 0.143120
4 -0.138533 0.076678
Y dataframe head:
Entry buyorsell pl
0 Y B -0.224533
1 Y B -0.350000
2 Y S 0.950000
3 Y B -0.167467
4 Y S 1.300000
import pandas as pd
import numpy as np
import os
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
X_train,X_test,y_train,y_test= train_test_split(X, y, test_size=0.3)
model = DecisionTreeClassifier()
model.fit(X_train,y_train)
我遇到错误
在model.fit(X_train,y_train)
回溯(最近通话最近一次):
适合的文件“ site-packages / sklearn / tree / tree.py”,第801行 X_idx_sorted = X_idx_sorted) 适合的文件“ site-packages / sklearn / tree / tree.py”,第140行 check_classification_targets(y) > check_classification_targets中的文件“ site-packages / sklearn / utils / multiclass.py”,第168行 y_type = type_of_target(y) > type_of_target中的文件“ site-packages / sklearn / utils / multiclass.py”,第249行 如果is_multilabel(y): > is_multilabel中的文件“ /site-packages/sklearn/utils/multiclass.py”,第151行 标签= np.unique(y) 唯一的文件“ site-packages / numpy / lib / arraysetops.py”,第223行 return _unique1d(ar,return_index,return_inverse,return_counts) _unique1d中的文件“ site-packages / numpy / lib / arraysetops.py”,第283行 ar.sort() TypeError:“ float”和“ str”的实例之间不支持“ <”
有人可以告诉我我在做什么错吗?