如何使用seaborn创建多线图?

时间:2018-09-13 07:35:39

标签: python python-3.x dataframe plot seaborn

我正在尝试Seaborn,以使我的绘图在视觉上比matplotlib更好。我有一个数据集,其中有一个“年份”列,我想在X轴上绘制,并在Y轴上使用不同的彩色线绘制4列,分别是A,B,C,D。我试图使用sns.lineplot方法执行此操作,但它只允许在X轴上使用一个变量,在Y轴上使用一个变量。我尝试这样做

sns.lineplot(data_preproc['Year'],data_preproc['A'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['B'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['C'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['D'], err_style=None)

但是这样一来,我在情节中就没有图例来显示哪条彩色线对应于什么。我尝试检查文档,但找不到正确的方法。

3 个答案:

答案 0 :(得分:7)

请参见the documentation

sns.lineplot(x="Year", y="signal", hue="label", data=data_preproc)

您可能需要以适当的方式重新组织数据框,以便为 x 数据提供一列,为 y 数据提供一列,保留数据点的标签。

您也可以只使用matplotlib.pyplot。如果导入seaborn,则许多改进的设计也将用于“常规” matplotlib图。 Seaborn确实是“只是”一组方法的集合,这些方法可以方便地向matplotlib提供数据和绘图参数。

答案 1 :(得分:2)

此:

sns.lineplot(data=data_preproc)

会做你想要的。

答案 2 :(得分:2)

Seaborn倾向于使用“长格式”作为输入。将您的DataFrame从其“宽格式”(每种测量类型一列)转换为长格式(所有测量值一列,用于指示类型的一列)的关键要素是pandas.melt。给定data_preproc的结构,使其充满随机值:

num_rows = 20
years = list(range(1990, 1990 + num_rows))
data_preproc = pd.DataFrame({
    'Year': years, 
    'A': np.random.randn(num_rows).cumsum(),
    'B': np.random.randn(num_rows).cumsum(),
    'C': np.random.randn(num_rows).cumsum(),
    'D': np.random.randn(num_rows).cumsum()})

通过以下方式获得具有四条线的单个图,每种测量类型一条:

sns.lineplot(x='Year', y='value', hue='variable', 
             data=pd.melt(data_preproc, ['Year']))

(请注意,“值”和“变量”是melt返回的默认列名称,可以根据您的喜好进行调整。)