我有一个散点图,它在x-axis
上有时间
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib import ticker
d = ({
'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
'B' : ['1','1','1','2','2','2','7','7','7','7'],
'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
})
df = pd.DataFrame(data=d)
fig,ax = plt.subplots()
x = df['A']
y = df['B']
x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())
plt.scatter(x_numbers, y)
plt.show()
我想将总秒数交换为实际时间戳,所以我加入了:
plt.xticks(x_numbers, x)
这导致x标记彼此重叠。
如果我使用:
plt.locator_params(axis='x', nbins=10)
结果与上面相同。如果我将nbins
更改为较小的刻度,则刻度不会重叠,但不会与各自的散点对齐。在分散点中,请不要与正确的时间戳对齐。
如果我使用:
M = 10
xticks = ticker.MaxNLocator(M)
ax.xaxis.set_major_locator(xticks)
ticks
不重叠,但不与它们各自的分散点对齐。
是否可以选择您使用的x-ticks
的数量,但仍与相应的数据点对齐。
例如对于下面的figure
。我可以只使用n
的{{1}}个数字,而不是全部使用吗?
输出2:
答案 0 :(得分:0)
首先,时间间隔不一致。 其次,这是一个高频序列。
在一般情况下,不需要与每个条目对应的xticks
匹配。而且,在那种情况下,您可以利用plt.plot_date(x, y)
和locators
和formatters
之类的DayLocator()
和DateFormatter('%Y-%m-%d')
之类的东西。
尽管在这种非常特殊的情况下,数据处于分钟级别,并且几乎没有点很接近,但是黑客可能会尝试使用用于x轴的数字系列x_numbers
。为了增加两点之间的距离,我尝试了cumsum()
,并在一定程度上消除了重叠,将rotation
赋予了xticks
。
fig, ax = plt.subplots(figsize=(10,6))
x = df['A']
y = df['B']
x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds()).cumsum()
plt.scatter(x_numbers, y)
plt.xticks(x_numbers, x, rotation=50)
plt.show()
答案 1 :(得分:0)
让我们使用一些xticklabel操作:
d = ({
'A' : ['08:00:00','08:10:00','08:12:00','08:26:00','08:29:00','08:31:00','10:10:00','10:25:00','10:29:00','10:31:00'],
'B' : ['1','1','1','2','2','2','7','7','7','7'],
'C' : ['X','Y','Z','X','Y','Z','A','X','Y','Z'],
})
df = pd.DataFrame(data=d)
fig,ax = plt.subplots()
x = df['A']
y = df['B']
x_numbers = (pd.to_timedelta(df['A']).dt.total_seconds())
plt.scatter(x_numbers, y)
loc, labels = plt.xticks()
newlabels = [str(pd.Timedelta(str(i)+ ' seconds')).split()[2] for i in loc]
plt.xticks(loc, newlabels)
plt.show()