我想将我的分类值转换为一种热门编码/ get_dummies,但是我有4340个唯一的分类值。因此,我收到内存错误。我该如何处理这种大的分类值。
更新:
由于数据敏感,因此我无法发布所有数据,因此我给列名指定了不同的名称,但值却是这样,并且由于无法发布所有4340个唯一分类值,因此我给出的样本很小。 / p>
index| ID
-------------
46 | R05
61 | M9901
72 | J301
103 | F411
135 | R070
139 | J069