所以基本上我有这个数据框,在这个数据框中有一个具有唯一值['cylinder','circle','light','cigar','diamond','oval',。 ..],我想将这些形状转换为数字,以便可以使用这些形状制作散点图。
当每个唯一形状都有自己的“ id”作为整数时,是否有办法制作另一个系列?
编辑:设法使其与pandas factorize一起使用
答案 0 :(得分:0)
尝试sklean
LabelEncoder
将您的categorical
列转换为Numerical
,然后即可进行绘制
import pandas as pd
df = pd.DataFrame(['cylinder', 'circle', 'light', 'cigar', 'diamond', 'oval'])
df.columns = ['shape']
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit_transform(df)
plt.scatter(df.index , df['shape'])