我希望能够快速比较两个不同的数据集,并通过查看两条回归线来查看它们在特定日期之间的相关性。
我一直试图在不同轴上绘制线图,每个线都有从特定日期到特定日期的回归线。两个图的日期都必须相同,我不希望回归线仅覆盖指定的自定义日期,以覆盖X轴上的所有日期。因此,regplot需要显示日期并了解它们是日期。
答案 0 :(得分:1)
我在任何地方都找不到答案,所以我想把它贴在这里,因为花了一些时间才弄清楚。
#'date': pandas.to_datetime(date), # pandas datesimport datetime
from matplotlib import pyplot, dates
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
timeLine = ["2020-01-01", "2021-01-01", "2022-01-01", "2023-01-01", "2024-01-01"]
# format data
df = pd.DataFrame({
'Dates': pd.to_datetime(timeLine),
'datenum': dates.datestr2num(timeLine),
'y1': [7, 6, 8, 8, 7],
'y2': [10, 13, 16, 13, 12]
})
# dates to float
@pyplot.FuncFormatter
def fake_dates(x, pos):
return dates.num2date(x).strftime('%Y-%m-%d')
# date range to constrain length of regression line
startDate = '"2020-02-02"'
endDate = '"2023-05-05"'
customDates = 'Dates > ' + startDate + ' and ' + 'Dates < ' + endDate + ''
"""y1"""
plt.ylim(ymin=0, ymax=20)
# regplot
plot = sns.regplot(x='datenum', y='y1', ci=65, scatter=False, line_kws={'linewidth':10}, data=df.query(customDates), color="red")
# original data
sns.lineplot(x='datenum', y='y1', data=df)
"""y2"""
ax2 = plt.twinx()
plt.ylim(ymin=0, ymax=20)
# regplot
x = sns.regplot(x='datenum', y='y2', ax=ax2, ci=65, scatter=False, line_kws={'linewidth':10}, data=df.query(customDates), color="red")
# original data
y= sns.lineplot(x='datenum', y='y2', ax=ax2, data=df, color="green")
# fake dates - visual
plot.xaxis.set_major_formatter(fake_dates)
plt.show()