我正在尝试Seaborn,以使我的绘图在视觉上比matplotlib更好。我有一个数据集,其中有一个“年份”列,我想在X轴上绘制,并在Y轴上使用不同的彩色线绘制4列,分别是A,B,C,D。我试图使用sns.lineplot方法执行此操作,但它只允许在X轴上使用一个变量,在Y轴上使用一个变量。我尝试这样做
sns.lineplot(data_preproc['Year'],data_preproc['A'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['B'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['C'], err_style=None)
sns.lineplot(data_preproc['Year'],data_preproc['D'], err_style=None)
但是这样一来,我在情节中就没有图例来显示哪条彩色线对应于什么。我尝试检查文档,但找不到正确的方法。
答案 0 :(得分:7)
sns.lineplot(x="Year", y="signal", hue="label", data=data_preproc)
您可能需要以适当的方式重新组织数据框,以便为 x 数据提供一列,为 y 数据提供一列,保留数据点的标签。
您也可以只使用matplotlib.pyplot
。如果导入seaborn
,则许多改进的设计也将用于“常规” matplotlib图。 Seaborn确实是“只是”一组方法的集合,这些方法可以方便地向matplotlib提供数据和绘图参数。
答案 1 :(得分:2)
此:
sns.lineplot(data=data_preproc)
会做你想要的。
答案 2 :(得分:2)
Seaborn倾向于使用“长格式”作为输入。将您的DataFrame从其“宽格式”(每种测量类型一列)转换为长格式(所有测量值一列,用于指示类型的一列)的关键要素是pandas.melt。给定data_preproc
的结构,使其充满随机值:
num_rows = 20
years = list(range(1990, 1990 + num_rows))
data_preproc = pd.DataFrame({
'Year': years,
'A': np.random.randn(num_rows).cumsum(),
'B': np.random.randn(num_rows).cumsum(),
'C': np.random.randn(num_rows).cumsum(),
'D': np.random.randn(num_rows).cumsum()})
通过以下方式获得具有四条线的单个图,每种测量类型一条:
sns.lineplot(x='Year', y='value', hue='variable',
data=pd.melt(data_preproc, ['Year']))
(请注意,“值”和“变量”是melt
返回的默认列名称,可以根据您的喜好进行调整。)