字符串索引必须是整数pandas dataframe

时间:2019-07-12 08:09:43

标签: python pandas

我在数据科学领域还很新。我正在尝试处理列表中的DataFrame数据。我已经阅读了几乎所有关于string indices must be integers的帖子,但对您毫无帮助。

我的DataFrame如下所示: enter image description here

我的列表看起来像这样

myList -> [0098b710-3259-4794-9075-3c83fc1ba058 1.561642e+09    32.775882   39.897459],
          [0098b710-3259-4794-9075-3c83fc1ba057 1.561642e+09    32.775882   39.897459],
and goes on...

这是Data,以防您需要复制家伙。

我需要一个个访问列表项(dataframes),然后如果两个时间戳之间的差大于dataframe

,则需要拆分60000

我编写了此代码,但是每当我尝试访问timestamp时,它都会产生错误。你们能帮忙解决这个问题吗

mycode:

a = []
for i in range(0,len(data_one_user)):
   x = data_one_user[i]
   x['label'] = (x['timestamp'] - x['timestamp'].shift(1))
   x['trip'] = np.where(x['label'] > 60000, True, False)
   x = x.drop('label', axis=1)
   x['trip'] = np.where(x['trip'] == True, a.append(x) , a.extend(x))
   #a = a.drop('trip', axis=1)
   x = a

编辑:如果您想知道对象类型

data_one_user -> list
data_one_user[0] = x -> pandas. core.frame.DataFrame
data_one_user[0]['timestamp'] = x['timestamp'] -> pandas.core.series.Series

Edit2:我添加了错误打印输出

enter image description here

Edit3:x的输出

enter image description here

1 个答案:

答案 0 :(得分:0)

我发现了导致错误的问题。在列表的末尾,重复标签。