因此,我有一个数据集(shape = (1000,38)
),几乎有一半需要分类,但目前为int64
或object
格式。我是python的新手,所以我的技能很弱,但是我可以使用以下命令手动转换每列:
data[col] = data[col].astype('category')
但是我敢肯定有一种使用for循环的简单方法。我的想法是:
for col in data :
if data.col.unique() <= 3
print(data[col] = data[col].astype('category'))
else print(data[col])
我知道这是不对的,但是我想做一个循环来标识具有column
3 >=
unique()
的任何values
并将该列转换为分类。任何帮助将不胜感激!