我有一个1.5M行和一列的数据帧。它看起来像:
我想将列'jobroles'拆分为多列,分别为1和0(热编码)。以下是我到目前为止所尝试的内容:
df_bits = df['jobroles'].str.join(sep=',').str.get_dummies(sep=',')
但它不只是分裂“,”而是每一个数字。例如,“2424638”被分成“2”,“3”,“4”,“6”和“8”。低于我得到的结果。
答案 0 :(得分:1)
应该就是这样:
df['jobroles'].str.get_dummies(',')