我正在EDA上处理这个kaggle数据集。
我正在使用以下代码在熊猫中处理一些箱线图:
coupon_list[["CATALOG_PRICE","VALIDEND_MONTH"]].boxplot(by='VALIDEND_MONTH')
我在这里遇到的问题是y轴的比例较大,并且很难读取该图。有什么方法可以限制该轴的六角?类似于ylim吗?
编辑:
数据集具有异常值,并添加了参数:
showfliers=False
似乎可以解决问题。
答案 0 :(得分:1)
这很奇怪,因为默认情况下Y轴是自动缩放的,请参见下面的示例。也许您的数据中有一些异常值。您可以分享更多代码吗?
import pandas as pd
import numpy as np
np.random.seed = 4
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
ax = df.boxplot()
这是与离群值相同的情节
# Generating some outliers
df.loc[0] = df.loc[0] * 10
ax = df.boxplot()
您可以尝试使用showfliers
选项来绘制没有异常值的框吗?在此示例中,Y比例返回到[0-100]。
ax = df.boxplot(showfliers=False)
showfliers
:布尔值,可选(True
) 显示超出上限的异常值。 matplotlib.axes.Axes.boxplot