如何使用python为数据框列中的字符串分配数字

时间:2018-06-27 04:24:48

标签: python pandas dataframe machine-learning data-analysis

我的数据框有6列,其中2列具有字符串值,我想用唯一的数字更改这些字符串,以便我的数据框应仅包含数字。

我用了labelEncoder和一个热编码器,但是那不起作用,因为我在一列中有很多值

我的数据框应如下所示:

 col1        col2                  col3
  1     This is a string 1           1
  2     This ia another121           2
  3     This is a string 1           1
  4     112dehjbdcb                  3
  5     helloooobjhd                 4
  6     no string                    5
  7     can be anyhtong              6
  8     This ia another121           2

此col2具有许多独特的字符串,例如80K。 请帮我解决这个问题

0 个答案:

没有答案