根据时间拆分推文

时间:2017-06-07 15:09:35

标签: python twitter

我在文件中有一些json格式的推文。 " created_at"每条推文中的关键字如下:

Sun May 28 23:59:59 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:56 +0000 2017
Sun May 28 23:59:56 +0000 2017

我想每10秒钟收集一次推文并在推文上做一些计算(例如考虑从2017年5月28日星期日23:59:59 +0000到2017年5月28日星期日23:59:49 +0000)和下一步从Sun 5月28日23:59:49 +0000 2017年到太阳5月28日23:59:39 +0000 2017年等等)。我怎么能这样做?

1 个答案:

答案 0 :(得分:1)

您可以使用pandas模块通过df = pd.read_json(filename)从json创建数据框,并使用TimeGrouper对时间间隔grouped = df.groupby(pd.TimeGrouper("10s"))进行分组。然后,您可以使用for name, group in grouped:

遍历这些组
df = pd.read_json(filename)
grouped = df.groupby(pd.TimeGrouper("10s"))

for name, group in grouped:
    ...