如何绘制多个数据集的小提琴图?

时间:2019-08-15 12:04:39

标签: python matplotlib seaborn violin-plot

我有多个具有不同大小的数据集,我想从中绘制一个小提琴图。我的数据集如下所示:

Input.CSV:

         city_A city_B  city C  city_D
cluster1   2       5      4      4
cluster2   3       3      2      8
cluster3   2       4      5      5
cluster4   3       5      4
cluster5           3      3
cluster6           5

注意:每个城市的集群规模和数量都不同。

我查看了一些帖子,例如here,但我不明白如何在一个图中绘制该数据集:

enter image description here

seaborn或matplotlib中的某些示例包含虚假数据,而我的数据为CSV格式,如上所示。如果您可以为使用像我的数据的代码提供帮助,那就太好了。

1 个答案:

答案 0 :(得分:2)

如果要绘制多个列表,则可以将它们作为列表列表进行绘制。您可以在这里https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.pyplot.violinplot.html

阅读文档
from matplotlib import pyplot as plt

A = [2, 5, 6, 10, 12, 8, 5]
B = [2, 2, 6,  8, 14, 5, 5]
C = [5, 7, 5, 13, 17, 7, 5]
D = [1, 4, 7, 12, 12, 5, 5]
E = [4, 1, 2, 11, 13, 7, 5]

fig, ax = plt.subplots(figsize=(5,5))
ax.violinplot([A,B,C,D,E][::-1],positions =[5,4,3,2,1],vert=False,showmeans=True)

def set_axis_style(ax, labels):
    ax.get_yaxis().set_tick_params(direction='out')
    ax.xaxis.set_ticks_position('bottom')
    ax.set_yticks(np.arange(1, len(labels) + 1))
    ax.set_yticklabels(labels)
    ax.set_ylim(0.25, len(labels) + 0.75)
    ax.set_ylabel('Sample name')

set_axis_style(ax,['A','B','C','D','E'][::-1])

enter image description here

Seaborn看起来是一种更好,更美观的数据框解决方案。

from matplotlib import pyplot as plt
import seaborn as sns

fig, axes = plt.subplots(figsize=(5,5))
sns.set(style="whitegrid")
sns.violinplot(data=df, ax = axes, orient ='h')

enter image description here