我有多个具有不同大小的数据集,我想从中绘制一个小提琴图。我的数据集如下所示:
Input.CSV:
city_A city_B city C city_D
cluster1 2 5 4 4
cluster2 3 3 2 8
cluster3 2 4 5 5
cluster4 3 5 4
cluster5 3 3
cluster6 5
注意:每个城市的集群规模和数量都不同。
我查看了一些帖子,例如here,但我不明白如何在一个图中绘制该数据集:
seaborn或matplotlib中的某些示例包含虚假数据,而我的数据为CSV格式,如上所示。如果您可以为使用像我的数据的代码提供帮助,那就太好了。
答案 0 :(得分:2)
如果要绘制多个列表,则可以将它们作为列表列表进行绘制。您可以在这里https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.pyplot.violinplot.html
阅读文档from matplotlib import pyplot as plt
A = [2, 5, 6, 10, 12, 8, 5]
B = [2, 2, 6, 8, 14, 5, 5]
C = [5, 7, 5, 13, 17, 7, 5]
D = [1, 4, 7, 12, 12, 5, 5]
E = [4, 1, 2, 11, 13, 7, 5]
fig, ax = plt.subplots(figsize=(5,5))
ax.violinplot([A,B,C,D,E][::-1],positions =[5,4,3,2,1],vert=False,showmeans=True)
def set_axis_style(ax, labels):
ax.get_yaxis().set_tick_params(direction='out')
ax.xaxis.set_ticks_position('bottom')
ax.set_yticks(np.arange(1, len(labels) + 1))
ax.set_yticklabels(labels)
ax.set_ylim(0.25, len(labels) + 0.75)
ax.set_ylabel('Sample name')
set_axis_style(ax,['A','B','C','D','E'][::-1])
Seaborn看起来是一种更好,更美观的数据框解决方案。
from matplotlib import pyplot as plt
import seaborn as sns
fig, axes = plt.subplots(figsize=(5,5))
sns.set(style="whitegrid")
sns.violinplot(data=df, ax = axes, orient ='h')