Question

我在数据科学领域还很新。我正在尝试处理列表中的DataFrame数据。我已经阅读了几乎所有关于string indices must be integers的帖子，但对您毫无帮助。

我的DataFrame如下所示：

我的列表看起来像这样

myList -> [0098b710-3259-4794-9075-3c83fc1ba058 1.561642e+09    32.775882   39.897459],
          [0098b710-3259-4794-9075-3c83fc1ba057 1.561642e+09    32.775882   39.897459],
and goes on...

这是Data，以防您需要复制家伙。

我需要一个个访问列表项（dataframes），然后如果两个时间戳之间的差大于dataframe

，则需要拆分60000

我编写了此代码，但是每当我尝试访问timestamp时，它都会产生错误。你们能帮忙解决这个问题吗

mycode：

a = []
for i in range(0,len(data_one_user)):
   x = data_one_user[i]
   x['label'] = (x['timestamp'] - x['timestamp'].shift(1))
   x['trip'] = np.where(x['label'] > 60000, True, False)
   x = x.drop('label', axis=1)
   x['trip'] = np.where(x['trip'] == True, a.append(x) , a.extend(x))
   #a = a.drop('trip', axis=1)
   x = a

编辑：如果您想知道对象类型

data_one_user -> list
data_one_user[0] = x -> pandas. core.frame.DataFrame
data_one_user[0]['timestamp'] = x['timestamp'] -> pandas.core.series.Series

Edit2：我添加了错误打印输出

Edit3：x的输出

Answer 1

我发现了导致错误的问题。在列表的末尾，重复标签。

字符串索引必须是整数pandas dataframe

1 个答案: