绘制pandas DataFrame和xaxis作为Timestamp产生空图

时间:2016-10-13 14:24:48

标签: datetime pandas matplotlib

我有一个pandas.DataFrame(df),它包含一些值和一个日期时间,它首先是一个字符串,但我使用

转换为时间戳
df['datetime'] = pd.to_datetime(df['Time [dd.mm.yyyy hh:mm:ss.ms]'], format="%d.%m.%Y %H:%M:%S.%f")

它似乎工作,我可以访问新列的元素的属性,如obj.day等。因此,结果列包含时间戳。当我尝试使用pyplot.plot(df['datetime'],df['value_name'])df.plot(x='datetime',y='value_name')绘制此图时,下面的图片就是重新分配。我尝试使用obj.to_pydatetime()转换时间戳,但这并没有改变任何内容。数据框本身由来自csvs的一些数据填充。令我感到困惑的是,有一些csvs它可以工作,但与其他人没有。我很确定转换到时间戳是成功的,但我可能是错的。我的时间窗口应该是2015-2016而不是1981-1700。如果我尝试从DataFrame中找到最小和最大时间戳,我将分别在2015年和2016年获得正确的时间戳。

Resulting Picture form pyplot.plot

编辑: df.head()给出:

扫描时间[dd.mm.yyyy hh:mm:ss.ms]频率[Hz]电压[V]
0 1.0 11.03.2014 10:13:04.270 50.0252 230.529
1 2.0 11.03.2014 10:13:06.254 49.9515 231.842
2 3.0 11.03.2014 10:13:08.254 49.9527 231.754
3 4.0 11.03.2014 10:13:10.254 49.9490 231.678
4 5.0 11.03.2014 10:13:12.254 49.9512 231.719

日期时间
0 2014-03-11 10:13:04.270
1 2014-03-11 10:13:06.254
2 2014-03-11 10:13:08.254
3 2014-03-11 10:13:10.254
4 2014-03-11 10:13:12.254

df.info()给出:

<class 'pandas.core.frame.DataFrame'>
Int64Index: 33270741 entries, 0 to 9140687
Data columns (total 5 columns):
Sweep                            float64
Time [dd.mm.yyyy hh:mm:ss.ms]    object
Frequency [Hz]                   float64
Voltage [V]                      float64
datetime                         datetime64[ns]
dtypes: datetime64[ns](1), float64(3), object(1)
memory usage: 1.5+ GB

我试图将'频率[Hz]'与'日期时间'进行对比。

1 个答案:

答案 0 :(得分:4)

我认为你需要set_index,然后设置两个轴的格式:

import matplotlib.pyplot as plt
import matplotlib.ticker as ticker

df['datetime'] = pd.to_datetime(df['Time [dd.mm.yyyy hh:mm:ss.ms]'],
                                   format="%d.%m.%Y %H:%M:%S.%f")

print (df)

df.set_index('datetime', inplace=True)

ax = df['Frequency [Hz]'].plot()

ticklabels = df.index.strftime('%Y-%m-%d')
ax.xaxis.set_major_formatter(ticker.FixedFormatter(ticklabels))
ax.yaxis.set_major_formatter(ticker.FormatStrFormatter('%.2f'))
plt.show()