我有一个约10列和50,000行的数据框。我想制作一个sns.countplot,仅显示那些value_count高于x的值。
import pandas as pd
import seaborn as sns
import random
mylist = []
mylist1 = [[],[],[],[],[],[],[],[],[],[],[]]
for j in range(0,11):
for i in range(0,100):
x = random.randint(1,(j+3))
mylist.append(x)
mylist1[j] = mylist
data = pd.DataFrame(mylist1)
data = data.transpose()
cols = ['col1','col2','col3','col4','col5','col6',
'col7','col8','col9','col10','col11']
data.columns = cols
通过饼图,我在代码中包含了最大的内容。
data['col1'].value_counts().nlargest(4,keep="first").plot.pie()
我不确定该如何处理海洋计数图。
我当前的代码是
sns.countplot(x="col1", data=data)
我只想在最终计数图中绘制前5个值。