Seaborn轴范围不适合Python中的数据范围

时间:2019-05-23 09:02:09

标签: python python-3.x matplotlib jupyter-notebook seaborn

我试图创建一个简单的散点图(我过去创建了几个散点图),因为我想了解服务台创建的票证与服务台关闭票证之间的关系比率。这两个功能是时间戳,但是当我绘制图形时,X和Y轴的范围似乎超出了所需范围,因为我从2017年到2019年的数据以及从2000年到2020年的图形都已绘制。 plt.xlim()plt.xlim(2016,2020),但是会产生一个绘图,其中所讨论的轴具有没有意义的值(请参见所附图片) 我的代码如下:

plt.figure(figsize=(10,5))
ax = sns.scatterplot(data=data, x=data['Created'], y=data['Closed'])

这将产生以下图形:

enter image description here

当我尝试修改plt.xlim()时,得到以下图表: enter image description here

这是我尝试绘制的一些数据:

          Created                  Closed
13  2018-01-16 16:23:21     2018-01-21 16:23:55
14  2018-01-11 17:51:18     2018-01-16 17:55:15
15  2018-01-12 13:03:50     2018-01-22 14:01:12
16  2018-01-11 13:28:55     2018-01-21 15:11:04
17  2018-01-04 09:58:36     2018-01-09 10:01:34
18  2018-01-23 09:19:36     2018-02-22 15:00:06
20  2019-04-09 10:50:54     2019-04-14 10:56:27
21  2019-04-08 19:22:49     2019-04-14 14:25:26
22  2019-04-09 12:34:24     2019-04-15 14:37:47
23  2019-04-09 17:22:10     2019-04-17 17:00:20
24  2019-04-09 09:58:52     2019-04-17 11:30:13
25  2019-04-08 20:08:01     2019-04-09 22:01:30
26  2019-04-09 18:40:13     2019-04-10 22:26:45
27  2019-04-09 19:29:04     2019-04-15 10:00:48
28  2019-04-10 02:43:15     2019-04-15 02:46:54
29  2019-04-10 03:04:36     2019-04-15 03:07:27
30  2019-04-10 03:12:02     2019-04-15 03:14:33

要重现我面临的问题,请在绘制之前运行以下命令:

data['Created']=pd.to_datetime(data['Created'])
data['Closed']=pd.to_datetime(data['Closed'])

我知道Seaborn和绘制日期时间存在问题,但是必须有一种正确绘制数据的方法。 所以我的问题是,我怎样才能使绘图放大到创建数据的范围?

2 个答案:

答案 0 :(得分:2)

问题是sns.scatterplot中的一个已知问题。 您可以用不同的方法解决问题,有两种方法:

使用简单的matplotlib图并设置线型和标记:

sns.set()
fig,ax= plt.subplots(1,1,figsize=(10,5))
plt.plot(df['Created'], df['Closed'],linestyle='None', marker='o')

或使用ax.plot_date

sns.set()
fig,ax= plt.subplots(1,1,figsize=(10,5))
ax.plot_date(df['Created'], df['Closed'])

enter image description here

答案 1 :(得分:2)

问题在于,当您这样做

plt.xlim(2016, 2020)

plt将限制设置为2016年和2020年的整数值,这些值将转换为时间戳,从历时开始大约为2000纳秒,例如

Timestamp('1970-01-01 00:00:00.000002020')

这就是为什么您不再看到分散的原因。而是将相应的时间戳传递给plt.xlim

plt.figure(figsize=(10,5))
ax = sns.scatterplot(data=data, x=data['Created'], y=data['Closed'])

plt.xlim(pd.to_datetime('2016-01-01'), # pd.to_datetime('2016') also works
        pd.to_datetime('2020-01-01'))
plt.show()

您将获得:

enter image description here