如何将系列的值(类型为字符串)更改为int?

时间:2019-04-01 16:40:14

标签: python numpy dataframe

所以基本上我有这个数据框,在这个数据框中有一个具有唯一值['cylinder','circle','light','cigar','diamond','oval',。 ..],我想将这些形状转换为数字,以便可以使用这些形状制作散点图。

当每个唯一形状都有自己的“ id”作为整数时,是否有办法制作另一个系列?

编辑:设法使其与pandas factorize一起使用

code

1 个答案:

答案 0 :(得分:0)

尝试sklean LabelEncoder将您的categorical列转换为Numerical,然后即可进行绘制

import pandas as pd
df = pd.DataFrame(['cylinder', 'circle', 'light', 'cigar', 'diamond', 'oval'])
df.columns = ['shape']
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit_transform(df)
plt.scatter(df.index , df['shape'])