使用此代码:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
pd.options.display.float_format = '{:.2f}'.format
a = pd.read_csv(r'C:\Users\Leonardo\Desktop\TRABALHO\dadosboias\MARINHA_TRATADO\Cabo Frio\boia_1\cabofrio.csv', na_values=['-9999.0'])
a.index = pd.to_datetime(a[['Year', 'Month', 'Day', 'Hour', 'Minute']])
pd.options.mode.chained_assignment = None
输出是这样的:
index wspd wdir gust hs
2009-06-24 15:21:00 1.4669884357700003 9.0 2.03121475722 nan
2009-06-24 16:21:00 1.4669884357700003 34.0 2.03121475722 nan
2009-06-24 17:21:00 0.677071585741 127.0 1.35414317148 nan
2009-06-24 18:21:00 0.22569052858000002 146.0 0.902762114322 nan
... ... ... ...
2013-02-10 17:21:00 nan nan nan nan
使用plt.plot(a.hs, 'r.')
进行简单的绘图输出是:
可以看出,数据框在“hs”列中有很多缺失的数据。主要目标是仅使用数据绘制周期。在图像中你可以看到2012-03到2013-3有很多好的“hs”数据,所以目标是绘制这个时期并得到这样的东西:
如果有人可以提供帮助,我会感激不尽。
答案 0 :(得分:1)
您可以选择相关范围,例如
a.loc['2012-03-01':'2013-03-01', 'hs'].plot()