Matplotlib:自动将时间列显示为散点图中y轴上的2小时刻度

时间:2020-06-09 17:59:00

标签: pandas datetime matplotlib time scatter

我有以下数据:

Time = ['2017-03-13 00:01:00', '2017-03-13 00:02:00', '2017-03-13 23:59:00']
Speed = [20, 40.5, 100]
Kilometer = [1.4, 2.0, 4.1]   
N130317 = pd.DataFrame({'Time':Time, 'Speed':Speed, 'Kilometer':Kilometer})

我使用以下时间转换了时间:

N130317['Time'] = pd.to_datetime(N130317['Time'], format = '%Y-%m-%d %H:%M:%S')
N130317['Time'] = pd.to_datetime(N130317['Time'], format).apply(lambda x: x.time())
N130317['Time'] = N130317['Time'].map(lambda t: t.strftime('%H:%M'))

我使用以下方法进行了绘制:

marker_size=1 #sets size of dots
cm = plt.cm.get_cmap('plasma_r') #sets colour scheme 
plt.scatter(N130317['Kilometer'], N130317['Time'], marker_size, c=N130317['Speed'], cmap=cm)
plt.title("NDW 13-03-17")
plt.xlabel("Kilometer")
plt.ylabel("Time")
plt.colorbar().set_label("Speed", labelpad=+1) #Makes a legend
plt.show()

但是图形显示如下(所有时间戳都显示在y轴上,显然没有足够的空间-我的日期中每分钟都有一个时间戳):

Picture

该如何解决?任何帮助将不胜感激。我在网上尝试了很多事情。

1 个答案:

答案 0 :(得分:1)

我用这些行创建了一些数据,将它们替换为您的数据:

from itertools import product

Time = [f'2017-03-13 {H}:{M}:{S}' for H, M, S in list(product([('0' + str(x))[-2:] for x in range(0, 24)],
                                                              [('0' + str(x))[-2:] for x in range(0, 60)],
                                                              [('0' + str(x))[-2:] for x in range(0, 60)]))]
Speed = list(130*np.random.rand(len(Time)))
Kilometer = list(50*np.random.rand(len(Time)))
N130317 = pd.DataFrame({'Time':Time, 'Speed':Speed, 'Kilometer':Kilometer})

我用以下这一行将N130317['Time']转换为时间戳:

N130317['Time'] = pd.to_datetime(N130317['Time'], format = '%Y-%m-%d %H:%M:%S')

然后我将yaxis格式属性设置为date:

import matplotlib.dates as md

ax=plt.gca()
xfmt = md.DateFormatter('%H:%M')
ax.yaxis.set_major_formatter(xfmt)

整个代码是:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.dates as md
from itertools import product

Time = [f'2017-03-13 {H}:{M}:{S}' for H, M, S in list(product([('0' + str(x))[-2:] for x in range(0, 24)],
                                                              [('0' + str(x))[-2:] for x in range(0, 60)],
                                                              [('0' + str(x))[-2:] for x in range(0, 60)]))]
Speed = list(130*np.random.rand(len(Time)))
Kilometer = list(50*np.random.rand(len(Time)))
N130317 = pd.DataFrame({'Time':Time, 'Speed':Speed, 'Kilometer':Kilometer})

N130317['Time'] = pd.to_datetime(N130317['Time'], format = '%Y-%m-%d %H:%M:%S')

marker_size = 1  # sets size of dots
cm = plt.cm.get_cmap('plasma_r') #sets colour scheme
plt.scatter(N130317['Kilometer'], N130317['Time'], marker_size, c=N130317['Speed'], cmap=cm)
ax=plt.gca()
xfmt = md.DateFormatter('%H:%M')
ax.yaxis.set_major_formatter(xfmt)
plt.title("NDW 13-03-17")
plt.xlabel("Kilometer")
plt.ylabel("Time")
plt.colorbar().set_label("Speed", labelpad=+1) #Makes a legend
plt.show()

这给了我这个情节:

enter image description here


请注意,pd.to_datetime()必须应用于datetime对象,而不是字符串。如果运行此代码:

hour = '2017-03-13 00:00:00'
pd.to_datetime(hour, format = '%H:%M')

您将收到以下错误消息:

ValueError: time data '2017-03-13 00:00:00' does not match format '%H:%M' (match)

因此,您需要使用以下代码,才能将字符串转换为datetime

hour = '2017-03-13 00:00:00'
hour = datetime.strptime(hour, '%Y-%m-%d %H:%M:%S')
pd.to_datetime(hour, format = '%H:%M')

这取决于您拥有的数据类型,因为我如上所述重新创建了数据,所以我没有遇到此问题。

版本信息

Python      3.7.0
matplotlib  3.2.1
numpy       1.18.4
pandas      1.0.4
相关问题