尝试绘制数据框丢失的百分比

时间:2019-07-09 13:40:43

标签: python python-3.x seaborn

我有一个名为'fs.missing_stats'的对象。这是数据示例。

fs.missing_stats.head(10)

                          missing_fraction
COMMONAREA_MEDI                     0.6953
COMMONAREA_MODE                     0.6953
COMMONAREA_AVG                      0.6953
NONLIVINGAPARTMENTS_AVG             0.6945
NONLIVINGAPARTMENTS_MEDI            0.6945
NONLIVINGAPARTMENTS_MODE            0.6945
LIVINGAPARTMENTS_MODE               0.6846
LIVINGAPARTMENTS_MEDI               0.6846
LIVINGAPARTMENTS_AVG                0.6846
FLOORSMIN_MEDI                      0.6751

我正在尝试绘制此数据。这是我正在测试的代码。

import seaborn as sns
prod_count = pd.DataFrame(fs.missing_stats.sort_values(ascending=False).head(20))
plt.figure()
sns.barplot(fs.missing_stats.index, fs.missing_stats['missing_fraction'].values, alpha=0.8)
plt.title('Percent Missing')
plt.ylabel('Missing', fontsize=12)
plt.xlabel('Features', fontsize=12)
plt.xticks(rotation=90)
plt.show()

我认为应该很接近,但出现以下错误。

TypeError: sort_values() missing 1 required positional argument: 'by'

索引可能有问题。只是一个猜测。我不确定如何调试这些事情。我可以帮忙吗?

1 个答案:

答案 0 :(得分:1)

我认为您正在寻找这样的东西:

import seaborn as sns
prod_count = pd.DataFrame(fs.missing_stats.sort_index().head(20))
plt.figure()
sns.barplot(fs.missing_stats[:20].index, fs.missing_stats[:20]['missing_fraction'].values, alpha=0.8)
plt.title('Percent Missing')
plt.ylabel('Missing', fontsize=12)
plt.xlabel('Features', fontsize=12)
plt.xticks(rotation=90)
plt.show()