我有一个包含以下详细信息(示例)的CSV文件:
UserType-age-Class-Gender-Grade-State
学生13-第八女B-孟加拉
学生17-第十一男一果阿
我想使用K均值进行聚类。我使用LabelEncoder()将数据转换为数字,并拟合了数据:
e = preprocessing.LabelEncoder()
le = student.apply(e.fit)
然后我腌制了对象“ le”:
pickle.dump(le, open('LabelEncoder.pkl', 'wb'))
之后,我将腌制的文件“ LabelEncoder.pkl”加载到另一个文件中:
le = pickle.load(open('LabelEncoder.pkl', 'rb'))
然后我尝试使用“ le”转换新数据:
new_data = ["Student", 10, "Fifth", "Male", "C", "Karnataka"]
le.transform(new_data)
执行此操作后出现错误:
ValueError: "Student" is an unknown string function
如何解决。请帮助我...
我正在使用:
python 2.7
jupyter
Ubuntu 16.04