不准确的情节袖扣情节

时间:2018-05-31 15:26:08

标签: python pandas plot plotly

我正在尝试使用袖扣创建绘图,但它们似乎不准确,或者为了更好地放置它,y轴似乎没有按顺序排列。

我正在使用的数据:

                  time
pos_slot    crane_gkey  
C1   319    85 days 09:29:11
     320    91 days 00:55:00
     329    100 days 21:15:00
     330    47 days 02:00:00
     331    0 days 11:25:00
     333    9 days 13:35:00
     334    3 days 01:15:00
     335    0 days 00:10:00
     336    0 days 05:00:00
     337    0 days 05:00:00
     338    2 days 21:10:00
     339    0 days 12:15:00
     345    9 days 22:50:00
     353    1 days 12:17:28
     362    1 days 08:05:00
     363    0 days 15:50:00
     369    1 days 08:05:00
     406    9 days 20:10:00
     407    12 days 22:05:00
     408    7 days 14:15:00

这继续了pos_slot的多个值 这是我用更大的桌子创建的一个组织。我使用以下内容创建一个情节

df1_bct_pos_ctimes3 = df1_bct_pos_ctimes.unstack(level = -2)
df1_bct_pos_ctimes3.iplot(kind = 'scatter')

我得到以下情节 enter image description here

正如你从数据中看到的那样,plor看起来并不准确,y轴似乎搞砸了

现在,如果我在桌面上运行袖扣而不拆开它并查看C1 for pos_slot我得到:

代码:

df1_bct_pos_ctimes.iplot(kind = 'scatter')

enter image description here

这似乎准确地描述了表中的值。

另外作为一个附带问题,我如何自定义轴标签更容易理解?

谢谢。

编辑:似乎将时间更改为总秒数修复了问题。我仍然想知道为什么会出现这个问题。谢谢。

1 个答案:

答案 0 :(得分:2)

我尝试在问题的前dataframe中重新创建error和类似的plot。在该图中,似乎iplot()time column视为string。因此,y-axis上的值似乎不符合预期。 (Jupyter Notebook 5.0.0, Python 3.6.6

导入库

import datetime
from datetime import date
from datetime import timedelta
import pandas as pd
import numpy as np
from plotly import __version__
%matplotlib inline

import plotly.offline as pyo
import plotly.graph_objs as go
from plotly.offline import iplot

import cufflinks as cf
from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot 
init_notebook_mode(connected=True)

init_notebook_mode(connected=True)
cf.go_offline()

创建示例数据

a = [319, 320,329,330,331,333,334,335,336,337,338,339,345,353,362,363,369,406,407,408]
b = ['C1']*len(a)
time = ['85 days 09:29:11', '91 days 00:55:00', '100 days 21:15:00', '47 days 02:00:00',
        '0 days 11:25:00', '9 days 13:35:00', '3 days 01:15:00', '0 days 00:10:00',
        '0 days 05:00:00', '0 days 05:00:00', '2 days 21:10:00', '0 days 12:15:00',
        '9 days 22:50:00', '1 days 12:17:28', '1 days 08:05:00', '0 days 15:50:00',
        '1 days 08:05:00', '9 days 20:10:00', '12 days 22:05:00', '7 days 14:15:00'
       ]

df = pd.DataFrame({'b':b, 'a':a, 'time':time})
df['time'] = df['time'].apply(pd.Timedelta)
df.head(2)

创建一个将时间转换为字符串的列

df['str_time'] = str(df.time)
df.dtypes

创建情节:时间为字符串格式

(注意:与问题相比,x轴和y轴都处于旋转状态。在这里,时间现在被视为一个类别。尽管格式与问题不同。)

df[['a', 'str_time']].iplot(kind = 'scatter')

enter image description here

创建图表:日期时间格式的时间

df[['a', 'time']].iplot(kind = 'scatter')

enter image description here