我的数据集中有10,000行,最后一列包含10个唯一的字符串(即每个字符串重复1000次)。如何将这10个字符串转换为整数,以便我可以在神经网络中使用它们。
答案 0 :(得分:1)
我猜你正在使用熊猫。例如,您有以下有用的列列表,
modelFeatures = [contains all the columns' names you use]
df = df[modelFeatures].astype(str)
print(df)
通过使用astype
,您可以将任何数据帧转换为int,float或str。