我一直在尝试使用机器学习来预测一些数据,但是它表明我无法将str转换为int错误,我什至尝试了标签编码器,但仍然无法成功运行该程序。
我尝试过标签编码
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import LabelEncoder
gender_data = pd.read_csv('gender.csv')
le = LabelEncoder()
X = gender_data.drop(columns=['Gender'])
y = gender_data['Gender']
Xv = X.values
yv = y.values
le_encoder_X = le.fit(Xv)
le_encoded_X = le.transform(Xv)
le_encoder_y = le.fit(yv)
le_encoded_y = le.transform(yv)
X_train, X_test, y_train, y_test = train_test_split(le_encoded_X, le_encoded_y, test_size=0.2)
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
ValueError跟踪(最近一次通话最近) 在()中 17 yv = y.values 18岁 ---> 19 le_encoder_X = le.fit(Xv) 20 le_encoded_X = le.fit(Xv) 21
F:\ Anaconda \ lib \ site-packages \ sklearn \ preprocessing \ label.py in fit(self,y) 93 self:返回self的一个实例。 94“”“ ---> 95 y = column_or_1d(y,warn = True) 96 self.classes_ = np.unique(y) 97返回自我
column_or_1d中的F:\ Anaconda \ lib \ site-packages \ sklearn \ utils \ validation.py(y,警告) 612返回np.ravel(y) 613 -> 614提高ValueError(“错误的输入形状{0}”。format(shape)) 615 616
ValueError:输入形状错误(66,4)