如何绘制分位数线并在Python中以绘图方式连接两个小提琴图?
例如,在R(https://github.com/GRousselet/rogme)中有一个库可以做到这一点。当有两个以上的组时,提供的库不一定起作用。
答案 0 :(得分:1)
在Plotly中绝对没有内置方法可以执行此特定操作。最好的办法可能是画一些线,如果需要对具有不同分位数值的多组数据执行此操作,请考虑编写一个函数或一些循环。
这是我入门的方式。如果要连接分组小提琴图中的相同分位数,则可以创建一个列表或数组来存储线的所有坐标。我承认我目前的情况很糟糕,因为它依赖于Plotly中具有从0开始并以1递增的y坐标的组。我建议可以使用一种方法来访问分组的小提琴图的y坐标。调查the documentation。
如果要添加文本框以指示分位数的值,则需要做更多的工作。
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
# generate some random data that is normally distributed
np.random.seed(42)
y1 = np.random.normal(0, 1, 1000) * 1.5 + 6
y2 = np.random.normal(0, 5, 1000) + 6
# group the data together and combine into one dataframe
df1 = pd.DataFrame({'Group': 'Group1', 'Values': y1})
df2 = pd.DataFrame({'Group': 'Group2', 'Values': y2})
df_final = pd.concat([df1, df2])
fig = px.strip(df_final, x='Values', y='Group', color_discrete_sequence=['grey'])
quantiles_list = [0.05, 0.10, 0.25, 0.50, 0.75, 0.90, 0.95]
## this is a bit hacky and relies on y coordinates for groups starting from 0 and increasing by 1
y_diff = 0
## these store the coordinates in order to connect the quantile lines
lower_coordinates, upper_coordinates = [], []
for group_name in df_final.Group.unique():
for quantile in quantiles_list:
quantile_value = np.quantile(df_final[df_final['Group'] == group_name].Values, quantile)
if group_name == 'Group1':
lower_coordinates.append((quantile_value, 0.2+1*y_diff))
if group_name == 'Group2':
upper_coordinates.append((quantile_value, -0.2+1*y_diff))
fig.add_shape(
# Vertical Line for Group1
dict(
type="line",
x0=quantile_value,
y0=-0.2+1*y_diff,
x1=quantile_value,
y1=0.2+1*y_diff,
line=dict(
color="black",
width=4
)
),
)
y_diff += 1
## draw connecting lines
for idx in range(len(upper_coordinates)):
fig.add_shape(
dict(
type="line",
x0=lower_coordinates[idx][0],
y0=lower_coordinates[idx][1],
x1=upper_coordinates[idx][0],
y1=upper_coordinates[idx][1],
line=dict(
color="chocolate",
width=4
)
),
)
fig.show()