下面显示了模拟数据的图表,其中包含我想要修改的xticks。默认情况下,pd.df.plot选择相隔大约3个月的日期作为刻度。但我想要的是每个月都是一个滴答声。做这个的最好方式是什么?季节性蜱怎么样?先感谢您。
答案 0 :(得分:7)
首先,您必须将pandas日期对象转换为python日期对象。由于matplotlib内部日期转换功能,需要进行此转换。然后使用matplotlib.dates
中的函数设置所需的格式化程序并勾选位置,如下所示:
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
import matplotlib.dates as mdates
# convert date objects from pandas format to python datetime
index = pd.date_range(start = "2015-07-01", end = "2017-01-01", freq = "D")
index = [pd.to_datetime(date, format='%Y-%m-%d').date() for date in index]
data = np.random.randint(1,100, size=len(index))
df = pd.DataFrame(data=data,index=index, columns=['data'])
print (df.head())
ax = df.plot()
# set monthly locator
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=1))
# set formatter
ax.xaxis.set_major_formatter(mdates.DateFormatter('%d-%m-%Y'))
# set font and rotation for date tick labels
plt.gcf().autofmt_xdate()
plt.show()
对于季节标签,您必须自己构建它,然后使用plt.setp
函数设置它(对于月02设置标签winter
,04 - spring
等):
plt.setp(new_labels, rotation=90, fontsize=9)
。
负责人:
data
2015-07-01 26
2015-07-02 33
2015-07-03 46
2015-07-04 69
2015-07-05 17
答案 1 :(得分:1)
我很难让@Serenity answer工作,因为我直接使用Matplotlib而不是绘制Pandas数据集。所以,如果你是其中之一,我的回答可能有所帮助。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
# Process dataset
bitcoin['Date'] = pd.to_datetime(bitcoin['Date'])
bitcoin['Open'] = pd.to_numeric(bitcoin['Open'])
# Plot
plt.figure()
plt.plot(bitcoin['Date'], bitcoin['Open'])
ax = plt.gca()
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=4))
ax.xaxis.set_major_formatter(mdates.DateFormatter('%d-%m-%Y'))
plt.gcf().autofmt_xdate() # Rotation
plt.show()
bitcoin[['Date', 'Open']].head()
Date Open
0 2017-09-05 4228.29
1 2017-09-04 4591.63
2 2017-09-03 4585.27
3 2017-09-02 4901.42
4 2017-09-01 4701.76
答案 2 :(得分:1)
此答案基于 the one by Serenity 以及 this one by ImportanceOfBeingErnest。
自定义时间序列刻度标签的最佳方法是使用 matplotlib.dates
模块 (mdates) 中的刻度定位器和格式器。尽管值得注意的是,如果您想要一个基于与您正在绘制的时间序列相同的单位的刻度频率,使用日期作为字符串来创建和格式化刻度标签可能更方便,如 {{3 }}。
如 this question concerning pandas bar plots 所述,pandas 使用 matplotlib 为时间序列创建带有自己的 in the documentation 的图:
<块引用>pandas 为时间序列图提供自定义格式化程序。这些更改了日期和时间轴标签的格式。默认情况下,自定义格式化程序仅应用于由 Pandas 使用 DataFrame.plot() 或 Series.plot() 创建的绘图。
pandas 时间序列图的刻度和标签目前默认格式如下:
import numpy as np # v 1.19.2
import pandas as pd # v 1.1.3
import matplotlib.dates as mdates # v 3.3.2
# Create random dataset stored as a pandas DataFrame with a DatetimeIndex
rng = np.random.default_rng(seed=1) # random number generator
date_day = pd.date_range(start='2015-07-01', end='2016-12-31', freq='D')
traffic = rng.lognormal(sigma=2, size=date_day.size)
df_day = pd.DataFrame(dict(traffic=traffic), index=date_day)
# Create pandas plot with default settings except for figure size
df_day.plot(figsize=(10,5));
为了能够使用 mdates 刻度定位器和格式化程序并覆盖默认刻度格式,matplotlib 必须正确识别熊猫日期。问题在于,pandas 和 matplotlib 使用不同的方法来计算用于在时间轴(默认为 x 轴)上定位刻度的日期数字。
在 Pandas 中,时间以纳秒为单位,从 (Unix 纪元的起源)的零开始,各个时间点存储为 1970-01-01 00:00:00
。但在为绘图创建时间尺度时,pandas 使用另一种编号系统,该系统从同一原点开始,然后在所选频率的每个周期内增加 1(在本例中,频率以天为单位)。
Matplotlib 使用与 pandas pandas timestamp objects 相同的默认来源,但日期始终为 since version 3.3.0 released in July 2020:
<块引用>Matplotlib 使用浮点数表示日期,指定自 1970-01-01 UTC 默认纪元以来的天数;例如,1970-01-01, 06:00 是浮点数 0.25。
在使用熊猫时,您可以通过运行 ax.get_xticks()
和 ax = df.plot()
来检查秤使用了哪些数字。
正如您可能已经猜到的那样,这意味着当时间序列的频率以天为单位时不需要日期转换,如下图所示,使用简单的自定义刻度定位器和格式化程序:
ax = df_day.plot(figsize=(10,5))
# Create custom ticks using matplotlib date tick locator and formatter
loc = mdates.MonthLocator(interval=2)
ax.xaxis.set_major_locator(loc)
fmt = mdates.DateFormatter('%b\n%Y')
ax.xaxis.set_major_formatter(fmt)
这种特殊情况可以方便地为 x 轴限制和次要 x 刻度保留其他 Pandas 默认设置。但这是一般规则的一个例外。
为了能够将 mdates 刻度定位器和格式化程序与任何类型频率的时间序列的熊猫图一起使用,您需要使用 ( 还 long-existing 和 absent-from-the-docstring ) x_compat=True
参数。以下示例说明了它与按月频率重新采样的相同数据集的用法。通常情况下,您只想稍微调整默认的 Pandas 格式,因此在以下示例中,从头开始重新创建默认格式以显示可以使用哪些方法来调整它:
# Resample time series to monthly frequency and plot it using date
# numbers that are compatible with mdates
df_month = df_day.resample('MS').sum()
ax = df_month.plot(figsize=(10,5), x_compat=True)
# Set major and minor date tick locators
maj_loc = mdates.MonthLocator(bymonth=np.arange(1,12,2))
ax.xaxis.set_major_locator(maj_loc)
min_loc = mdates.MonthLocator()
ax.xaxis.set_minor_locator(min_loc)
# Set major date tick formatter
zfmts = ['', '%b\n%Y', '%b', '%b-%d', '%H:%M', '%H:%M']
maj_fmt = mdates.ConciseDateFormatter(maj_loc, zero_formats=zfmts, show_offset=False)
ax.xaxis.set_major_formatter(maj_fmt)
ax.figure.autofmt_xdate(rotation=0, ha='center')
ax.set_xlim(df_month.index.min(), df_month.index.max());
文档:、pd.date_range
、date format codes、mdates.ConciseDateFormatter