我有一个数据集,其中包含每日访问,注册和营销投资的网站数量。该公司进行广告和营销投资以改善访问和注册。我想知道今天的市场营销投资是否会在3天的访问和注册结果滞后时间内产生影响。 !(https://imgur.com/f6N6Cop)
我正在使用python和pandas解决此问题。我已经尝试了一些熊猫关联,但是只给出了关联,没有时间滞后。然后,我尝试在1到3天内将访问和注册的价值滞后一些,以便发现当今的投资与滞后访问和注册之间的相关性,但是我不知道这是否是解决问题的最佳方法。
df['VISITS_+1'] = df['VISITS'].shift(-1)
df['VISITS_+2'] = df['VISITS'].shift(-2)
df['VISITS_+3'] = df['VISITS'].shift(-3)
df['REGISTRATIONS+1'] = df['REGISTRATIONS'].shift(-1)
df['REGISTRATIONS+2'] = df['REGISTRATIONS'].shift(-2)
df['REGISTRATIONS+3'] = df['REGISTRATIONS'].shift(-3)
corr = df.corr(method='pearson')
f, ax = plt.subplots(figsize=(12, 9))
sns.heatmap(corr,
xticklabels=corr.columns.values,
yticklabels=corr.columns.values, vmax=.8, square=True)
corr.style.background_gradient()
corr.style.background_gradient().set_precision(3)
我希望运用最好的方法,使我得出一个结论,即是否存在相关性,表明我们在1-3天的访问量和注册量是否来自过去的短期营销投资。