我刚开始使用pandas库来分析大型数据集。我正在分析具有属性issuercountrycode
的信用卡数据,其中包含117种可能性。在尝试可视化我的数据集中使用的issuercountrycode
时,我目前使用以下代码生成饼图。
df['issuercountrycode'].value_counts().plot(kind='pie')
plt.show()
这导致以下饼图:
正如您所看到的,这并不理想,因为通常不会使用多个值。在使用value_counts()函数时,pandas是否有可能添加阈值,并将低于某个值的值添加到“rest”组?这些类型的操作甚至可以在熊猫中使用吗?