我有一个pandas数据框,其中包含一些我想在matplotlib中绘制的sar输出。示例数据如下。
>>> cpu_data.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 70 entries, 0 to 207
Data columns (total 8 columns):
00:00:01 70 non-null datetime64[ns]
CPU 70 non-null object
%user 70 non-null float64
%nice 70 non-null float64
%system 70 non-null float64
%iowait 70 non-null float64
%steal 70 non-null float64
%idle 70 non-null float64
dtypes: float64(6), object(2)
memory usage: 4.4+ KB
>>> cpu_data
00:00:01 CPU %user %nice %system %iowait %steal %idle
0 00:10:01 all 0.30 0.00 0.30 0.06 0.0 99.34
3 00:20:01 all 0.09 0.00 0.13 0.00 0.0 99.78
6 00:30:01 all 0.07 0.00 0.11 0.00 0.0 99.81
9 00:40:01 all 0.08 0.00 0.11 0.00 0.0 99.80
12 00:50:01 all 0.08 0.00 0.13 0.00 0.0 99.79
15 01:00:04 all 0.09 0.00 0.13 0.00 0.0 99.77
18 01:10:01 all 0.27 0.00 0.28 0.00 0.0 99.46
21 01:20:01 all 0.09 0.00 0.11 0.00 0.0 99.79
24 01:30:04 all 0.12 0.00 0.13 0.01 0.0 99.74
27 01:40:01 all 0.08 0.00 0.11 0.01 0.0 99.80
30 01:50:01 all 0.09 0.00 0.13 0.01 0.0 99.77
我想使用时间戳作为x轴进行绘制。我已经编写了以下代码。
import pandas as pd
import os
import matplotlib.pyplot as plt
import matplotlib.dates as md
import dateutil
import matplotlib.dates as mdates
cpu_data[cpu_data.columns[0]] = [dateutil.parser.parse(s) for s in cpu_data[cpu_data.columns[0]]]
plt.subplots_adjust(bottom=0.2)
plt.xticks( rotation=25 )
ax=plt.gca()
ax.xaxis_date()
xfmt = md.DateFormatter('%H:%M:%S')
ax.xaxis.set_major_formatter(xfmt)
cpu_data.plot(ax=ax)
plt.show()
但是我收到以下错误
ValueError: view limit minimum -5.1000000000000005 is less than 1 and is an invalid Matplotlib date value. This often happens if you pass a non-datetime value to an axis that has datetime units
这没有任何意义,因为我手动将所有时间戳字符串转换为日期时间对象
cpu_data[cpu_data.columns[0]] = [dateutil.parser.parse(s) for s in cpu_data[cpu_data.columns[0]]]
但是它们似乎不是正确的数据类型
2018-09-30 00:10:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
2018-09-30 00:20:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
2018-09-30 00:30:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
2018-09-30 00:40:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
2018-09-30 00:50:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
2018-09-30 01:00:01 <class 'pandas._libs.tslibs.timestamps.Timestamp'>
我不知道该如何解决。我尝试使用plt.xlim(cpu_data[cpu_data.columns[0]].iloc[0])
手动将x轴设置为从日期时间对象值开始,但这会产生相同的错误。我真的在这里迷路了。任何指导将不胜感激。如果有帮助,我可以提供更多信息。
编辑:
我认为日期不是正确的数据类型(如错误所示)。熊猫似乎一直在将时间列(列0)中的数据转换为pandas._libs.tslibs.timestamps.Timestamp
类型的对象。我认为这应该是matplotlib抱怨的datetime对象。
答案 0 :(得分:1)
对于那些感兴趣的人,这就是我最终使用matplotlib绘制数据的方式
# Plot cpu
plt.figure(1)
plt.subplots_adjust(bottom=0.2)
plt.xticks(rotation=25)
ax=plt.gca()
ax.xaxis_date()
xfmt = md.DateFormatter('%H:%M:%S')
ax.xaxis.set_major_formatter(xfmt)
plt.title(f'CPU usage on {remote_host}')
lines = plt.plot(dates, cpu_data[cpu_data.columns[2:]])
ax.legend(lines, [str(col) for col in list(cpu_data.columns[2:])])
plot.show()