区分数字列和分类列

时间:2019-02-27 13:24:37

标签: python data-science-experience

我已经开始在一家公司工作,我们正在使用许多数据表,其中大多数不包含列的描述,如果列是分类的,则大多数类别的定义都不会定义。我提供了一个解决方案,用于将类别列和类别的列表发送给业务合作伙伴,并要求他们填写类别含义。

但是有人可以帮忙找出哪些列是类别的,因为我不能手动完成,因为每个表有20多个,每个列都有70-80列?

我能想到的一些解决方案是:

  1. 检查分发情况。
  2. 唯一值与总大小的比值大于阈值,然后为数值的比率。

有人还有其他想法吗?

1 个答案:

答案 0 :(得分:0)

考虑数据框为df,您可以执行以下操作:

df.dtypes

这将为您的数据框提供列类型。