所以我在熊猫中有一个数据框,如下所示:
date max min rain snow ice
0 2019-01-01 58 39 0.06 0.0 0.0
1 2019-01-01 58 39 0.06 0.0 0.0
2 2019-01-01 58 39 0.06 0.0 0.0
3 2019-01-01 58 39 0.06 0.0 0.0
4 2019-01-01 58 39 0.06 0.0 0.0
目标是创建一个折线图,在x轴上显示最高温度,在y轴上显示该温度下每个日期的频率。
所以基本上,日期列表是商店交易,我想看看温度对每天交易次数的影响。
我尝试使用此功能按日期对weather_frame进行分组,但是我无法获得在x轴上显示温度的图。
max_temp = weather_frame.groupby(weather_frame.date).size()
我已在下面附加了文件。我必须删除其中一些内容,以使其不超过粘贴容器的大小限制,因此,该图可能看起来已损坏。 Data Link
答案 0 :(得分:0)
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
date_freq = weather_frame.groupby(weather_frame.date).size()
max_temp = weather_frame[['date', 'max']].groupby(weather_frame.date).mean()
sns.set()
plt.figure()
sns.regplot(x=max_temp, y=date_freq)
plt.xlabel('Maximum Temperature')
plt.ylabel('Number of Transactions per Day')
最高温度和每天交易量之间似乎存在轻微的正相关关系。