Question

我刚开始使用pandas库来分析大型数据集。我正在分析具有属性issuercountrycode的信用卡数据，其中包含117种可能性。在尝试可视化我的数据集中使用的issuercountrycode时，我目前使用以下代码生成饼图。

df['issuercountrycode'].value_counts().plot(kind='pie')
plt.show()

这导致以下饼图：

正如您所看到的，这并不理想，因为通常不会使用多个值。在使用value_counts（）函数时，pandas是否有可能添加阈值，并将低于某个值的值添加到“rest”组？这些类型的操作甚至可以在熊猫中使用吗？

Answer 1

您需要使用boolean indexing和_propA来计算：

样品：

sum