Pandas for index on index

时间:2013-11-04 20:29:40

标签: python datetime pandas normalization

我有一个pandas数据框,该数据框由一些非唯一非连续的ID编号索引。

  

X
  class'pandas.core.frame.DataFrame'
  Int64Index:814061条目,8536896至8498857
  数据列(共1列):
  收到814061个非空值
  dtypes:datetime64ns

x ['received']是不一样长度的时间戳。

x.ix[i] might have len() == 20  
x.ix[j] might have len() == 32. 

对于任何x.ix [i]我可以将时间戳放入[0,1]范围

df['totalseconds'] = x.ix[i]['received']-x.ix[i]['received'].min()
y = x.ix[i]['received'].max()-x.ix[i]['received'].min()
z = timedelta.total_seconds(y)
df['seconds'] = df['totalseconds'].apply(lambda x: x / timedelta64(1, 's'))
df['norm'] = df['seconds']/z

我正在尝试将x中每个索引的时间段规范化。但由于某种原因我遇到了麻烦。

tldr;如何通过索引ID将所有时间戳记放入[0,1]范围?

0 个答案:

没有答案