我正在使用plotly从我的数据中制作一些样式完整的箱形图。 我的图表基于最底部给出的示例: https://plot.ly/python/box-plots/ 大多数情况下都可以正常工作,但是某些数据具有极端的异常值。以至于这些图形不再正确可见。 有没有一种方法可以根据四分位间距动态设置边距? 假设图中的最高Q3值是2,但我的离群值是15。是否可以通过设置仅显示数值(假设值是Q3的3倍)的方式设置边距?
我尝试将自动调整范围和自动边距设置为True,这没有帮助:
CUST_ID CH ORDER_TIME ITEM_ID
1: A001 CH1 2018-01-01 08:00:00 110
2: A001 CH3 2018-01-01 13:30:00 110
3: A001 CH2 2018-02-14 14:40:00 112
4: A002 CH2 2018-01-01 14:15:00 112
5: A002 CH3 2018-02-02 10:00:00 114
6: A003 CH1 2018-01-01 10:40:00 111
bad margins 我还尝试手动计算最大Q3(尽管如果我可以直接从图表中提取信息,我会更喜欢它。我的意思是必须将其存储在某个地方,因为它显示在交互式图表中...),然后将边距t设置为最大计算值的3倍:
CUST_ID CH ORDER_TIME ITEM_ID START END
1: A001 CH1 2018-01-01 08:00:00 110 2018-01-01 07:30:00 2018-01-01 08:30:00
2: A001 CH3 2018-01-01 13:30:00 110 <NA> <NA>
3: A001 CH2 2018-02-14 14:40:00 112 2018-02-14 14:00:00 2018-02-14 14:30:00
4: A002 CH2 2018-01-01 14:15:00 112 <NA> <NA>
5: A002 CH3 2018-02-02 10:00:00 114 2018-02-02 08:30:00 2018-02-02 09:30:00
6: A003 CH1 2018-01-01 10:40:00 111 2018-01-01 09:30:00 2018-01-01 10:30:00
但这确实切断了我的图表的标题,因此也不起作用。
cutoff title 任何人还有其他建议,如何正确格式化具有较大异常值的图形?