获取seaborn boxplot box

时间:2017-07-03 01:50:16

标签: matplotlib seaborn

我有一个seaborn boxplot(sns.boxplot),我想在其上添加一些观点。例如,假设我有这个pandas DataFrame:

[In]  import pandas as pd
      import numpy as np
      import matplotlib.pyplot as plt
      import seaborn as sns

      df = pd.DataFrame({'Property 1':['a']*100+['b']*100,
                         'Property 2': ['w', 'x', 'y', 'z']*50,
                         'Value': np.random.normal(size=200)})
      df.head(3)

[Out]         Property 1    Property 2  Value
           0    a               w       1.421380
           1    a               x      -1.034465
           2    a               y       0.212911
[In]  df.shape
[Out] (200, 3)

我可以很容易地生成一个带有seaborn的盒子图:

[In]  sns.boxplot(x='Property 2', hue='Property 1', y='Value', data=df)
[Out]

Boxplot alone

现在说我想为我的样本中的特定案例添加标记。我可以接近这个:

[In]   specific_case = pd.DataFrame([['a', 'w', '0.5'],
                                     ['a', 'x', '0.2'],
                                     ['a', 'y', '0.1'],
                                     ['a', 'z', '0.3'],
                                     ['b', 'w', '-0.5'],
                                     ['b', 'x', '-0.2'],
                                     ['b', 'y', '0.3'],
                                     ['b', 'z', '0.5']
                                    ], 
                                    columns = df.columns
                                   )
[In]  sns.boxplot(x='Property 2', hue='Property 1', y='Value', data=df)
      plt.plot(np.arange(-0.25, 3.75, 0.5),
               specific_case['Value'].values, 'ro')
[Out] 

Adding markers with human guess

当然,这并不令人满意。

然后我使用了this answer来讨论如何将bBoxthis tutorial关于将diplay坐标转换为数据坐标来编写此函数:

[In] def get_x_coordinates_of_seaborn_boxplot(ax, x_or_y):
         display_coordinates = []
         inv = ax.transData.inverted()    
         for c in ax.get_children():
             if type(c) == mpl.patches.PathPatch:
                 if x_or_y == 'x':         
                     display_coordinates.append(
                         (c.get_extents().xmin+c.get_extents().xmax)/2)
                 if x_or_y == 'y':
                     display_coordinates.append(
                         (c.get_extents().ymin+c.get_extents().ymax)/2)
         return inv.transform(tuple(display_coordinates)) 

这对我的第一个色调非常有用,但对于我的第二个色调却没有用:

[In]  ax = sns.boxplot(x='Property 2', hue='Property 1', y='Value', data=df)
      coords = get_x_coordinates_of_seaborn_boxplot(ax, 'x')
      plt.plot(coords, specific_case['Value'].values, 'ro')
[Out] 

Almost there...

如何获取所有盒子的数据坐标?

1 个答案:

答案 0 :(得分:1)

我不确定这些转变的目的。但似乎真正的问题只是将specific_case处的点绘制在正确的位置。每个箱图的x坐标从整数移动0.2。 (这是因为默认情况下条形宽度为0.8,你有2个盒子,每个宽度为0.4,其中一半是0.2。) 然后,您需要排列x值以适合specific_case数据帧的值。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame({'Property 1':['a']*100+['b']*100,
                 'Property 2': ['w', 'x', 'y', 'z']*50,
                 'Value': np.random.normal(size=200)})

specific_case = pd.DataFrame([['a', 'w', '0.5'],
                             ['a', 'x', '0.2'],
                             ['a', 'y', '0.1'],
                             ['a', 'z', '0.3'],
                             ['b', 'w', '-0.5'],
                             ['b', 'x', '-0.2'],
                             ['b', 'y', '0.3'],
                             ['b', 'z', '0.5']
                            ],  columns = df.columns )
ax = sns.boxplot(x='Property 2', hue='Property 1', y='Value', data=df)

X = np.repeat(np.atleast_2d(np.arange(4)),2, axis=0)+ np.array([[-.2],[.2]]) 
ax.plot(X.flatten(), specific_case['Value'].values, 'ro', zorder=4)

plt.show()

enter image description here