我正在尝试绘制带有大量样本的熊猫系列:
In [1]: vp_series = pd.Series(data=raw_df.Count, index=raw_df.Timestamp)
In [2]: len(vp_series)
Out[2]: 17499650
In [3]: vp_series.index[-1]
Out[3]: 559888625359
当我尝试绘制该系列图时,生成的图看起来像这样:
In [4]: vp_series.plot()
显然并非所有数据点都被绘制,并且x轴上的最大值仅约为1.75e7
,而不是5.59e11
。
但是,当我尝试在Julia中绘制相同的数据(使用Plots和PyPlot后端)时,它会生成正确的图形:
在这里我应该怎么做才能使绘图包含所有数据点?我试图在matplotlib和Pandas.Series的文档中进行搜索,但一无所获。
答案 0 :(得分:0)
我发现原因是我用来创建pandas.Series
的方式是错误的。代替
vp_series = pd.Series(data=raw_df.Count, index=raw_df.Timestamp)
我应该使用
vp_series = pd.Series(data=raw_df.Count.values, index=raw_df.Timestamp)
第一种方法使我的系列包含许多未绘制的缺失值(NaN
)。原因在here中有很好的解释。
我知道我没有正确提出问题,我感谢所有评论。