我有同样的怀疑category ordering issue。在此内核中Allstate EDA跳到他对分类要素进行计数的部分,看A
和B
的顺序为cat2
和cat11
的变化和许多其他人。但是,在这种情况下,我们不知道有多少个唯一类别,因为后面的行还有很多。是否有一种简单的方法来修复它以获得相同的顺序而无需编写复杂的循环来运行可能类别的字典?
编辑:由于数据集很大,我不知道如何在这里重现它。但为了使它更清楚,代码使用循环
for i in range(n_rows):
fg,ax = plt.subplots(nrows=1,ncols=n_cols,sharey=True,figsize=(12, 8))
for j in range(n_cols):
sns.countplot(x=cols[i*n_cols+j], data=dataset, ax=ax[j])
其中n_cols = 4
和n_rows = 29
。
问题是,据我所知,我们会给order
一个列表或系列。例如。 order = ['A', 'B']
。但是在这个数据集中,对于某些列,只有2个类别A和B,但对于其他列,每列有很多类别和不同数量的类别。
(我觉得这样无处可去)