更改Xticks Matplotlib

时间:2018-06-28 00:16:28

标签: python pandas matplotlib plot axis

我有一个散点图,它在x-axis上有时间

import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import ticker

d = ({
    'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
    'B' : ['1','1','1','2','2','2','7','7','7','7'],     
    'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
    })

df = pd.DataFrame(data=d)

fig,ax = plt.subplots()

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())

plt.scatter(x_numbers, y)
plt.show()

输出1: enter image description here

我想将总秒数交换为实际时间戳,所以我加入了:

plt.xticks(x_numbers, x)

这导致x标记彼此重叠。

如果我使用:

plt.locator_params(axis='x', nbins=10) 

结果与上面相同。如果我将nbins更改为较小的刻度,则刻度不会重叠,但不会与各自的散点对齐。在分散点中,请不要与正确的时间戳对齐。

如果我使用:

M = 10
xticks = ticker.MaxNLocator(M)
ax.xaxis.set_major_locator(xticks) 

ticks不重叠,但不与它们各自的分散点对齐。

是否可以选择您使用的x-ticks的数量,但仍与相应的数据点对齐。

例如对于下面的figure。我可以只使用n的{​​{1}}个数字,而不是全部使用吗?

输出2:

enter image description here

2 个答案:

答案 0 :(得分:0)

首先,时间间隔不一致。 其次,这是一个高频序列。

在一般情况下,不需要与每个条目对应的xticks匹配。而且,在那种情况下,您可以利用plt.plot_date(x, y)locatorsformatters之类的DayLocator()DateFormatter('%Y-%m-%d')之类的东西。

尽管在这种非常特殊的情况下,数据处于分钟级别,并且几乎没有点很接近,但是黑客可能会尝试使用用于x轴的数字系列x_numbers。为了增加两点之间的距离,我尝试了cumsum(),并在一定程度上消除了重叠,将rotation赋予了xticks

fig, ax = plt.subplots(figsize=(10,6))

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds()).cumsum()

plt.scatter(x_numbers, y)
plt.xticks(x_numbers, x, rotation=50)
plt.show()

enter image description here

答案 1 :(得分:0)

让我们使用一些xticklabel操作:

d = ({
    'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
    'B' : ['1','1','1','2','2','2','7','7','7','7'],     
    'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
    })

df = pd.DataFrame(data=d)

fig,ax = plt.subplots()

x = df['A']
y = df['B']

x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())

plt.scatter(x_numbers, y)
loc, labels = plt.xticks()
newlabels = [str(pd.Timedelta(str(i)+ ' seconds')).split()[2] for i in loc]
plt.xticks(loc, newlabels)
plt.show()

输出: enter image description here