我有一个pandas.DataFrame(df),它包含一些值和一个日期时间,它首先是一个字符串,但我使用
转换为时间戳df['datetime'] = pd.to_datetime(df['Time [dd.mm.yyyy hh:mm:ss.ms]'], format="%d.%m.%Y %H:%M:%S.%f")
它似乎工作,我可以访问新列的元素的属性,如obj.day等。因此,结果列包含时间戳。当我尝试使用pyplot.plot(df['datetime'],df['value_name'])
或df.plot(x='datetime',y='value_name')
绘制此图时,下面的图片就是重新分配。我尝试使用obj.to_pydatetime()
转换时间戳,但这并没有改变任何内容。数据框本身由来自csvs的一些数据填充。令我感到困惑的是,有一些csvs它可以工作,但与其他人没有。我很确定转换到时间戳是成功的,但我可能是错的。我的时间窗口应该是2015-2016而不是1981-1700。如果我尝试从DataFrame中找到最小和最大时间戳,我将分别在2015年和2016年获得正确的时间戳。
Resulting Picture form pyplot.plot
编辑:
df.head()
给出:
扫描时间[dd.mm.yyyy hh:mm:ss.ms]频率[Hz]电压[V]
0 1.0 11.03.2014 10:13:04.270 50.0252 230.529
1 2.0 11.03.2014 10:13:06.254 49.9515 231.842
2 3.0 11.03.2014 10:13:08.254 49.9527 231.754
3 4.0 11.03.2014 10:13:10.254 49.9490 231.678
4 5.0 11.03.2014 10:13:12.254 49.9512 231.719
日期时间
0 2014-03-11 10:13:04.270
1 2014-03-11 10:13:06.254
2 2014-03-11 10:13:08.254
3 2014-03-11 10:13:10.254
4 2014-03-11 10:13:12.254
和df.info()
给出:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 33270741 entries, 0 to 9140687
Data columns (total 5 columns):
Sweep float64
Time [dd.mm.yyyy hh:mm:ss.ms] object
Frequency [Hz] float64
Voltage [V] float64
datetime datetime64[ns]
dtypes: datetime64[ns](1), float64(3), object(1)
memory usage: 1.5+ GB
我试图将'频率[Hz]'与'日期时间'进行对比。
答案 0 :(得分:4)
我认为你需要set_index
,然后设置两个轴的格式:
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
df['datetime'] = pd.to_datetime(df['Time [dd.mm.yyyy hh:mm:ss.ms]'],
format="%d.%m.%Y %H:%M:%S.%f")
print (df)
df.set_index('datetime', inplace=True)
ax = df['Frequency [Hz]'].plot()
ticklabels = df.index.strftime('%Y-%m-%d')
ax.xaxis.set_major_formatter(ticker.FixedFormatter(ticklabels))
ax.yaxis.set_major_formatter(ticker.FormatStrFormatter('%.2f'))
plt.show()