我在数据科学领域还很新。我正在尝试处理列表中的DataFrame
数据。我已经阅读了几乎所有关于string indices must be integers
的帖子,但对您毫无帮助。
我的列表看起来像这样
myList -> [0098b710-3259-4794-9075-3c83fc1ba058 1.561642e+09 32.775882 39.897459],
[0098b710-3259-4794-9075-3c83fc1ba057 1.561642e+09 32.775882 39.897459],
and goes on...
这是Data,以防您需要复制家伙。
我需要一个个访问列表项(dataframes
),然后如果两个时间戳之间的差大于dataframe
60000
我编写了此代码,但是每当我尝试访问timestamp
时,它都会产生错误。你们能帮忙解决这个问题吗
mycode:
a = []
for i in range(0,len(data_one_user)):
x = data_one_user[i]
x['label'] = (x['timestamp'] - x['timestamp'].shift(1))
x['trip'] = np.where(x['label'] > 60000, True, False)
x = x.drop('label', axis=1)
x['trip'] = np.where(x['trip'] == True, a.append(x) , a.extend(x))
#a = a.drop('trip', axis=1)
x = a
编辑:如果您想知道对象类型
data_one_user -> list
data_one_user[0] = x -> pandas. core.frame.DataFrame
data_one_user[0]['timestamp'] = x['timestamp'] -> pandas.core.series.Series
Edit2:我添加了错误打印输出
Edit3:x的输出
答案 0 :(得分:0)
我发现了导致错误的问题。在列表的末尾,重复标签。