我在文件中有一些json格式的推文。 " created_at"每条推文中的关键字如下:
Sun May 28 23:59:59 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:56 +0000 2017
Sun May 28 23:59:56 +0000 2017
我想每10秒钟收集一次推文并在推文上做一些计算(例如考虑从2017年5月28日星期日23:59:59 +0000到2017年5月28日星期日23:59:49 +0000)和下一步从Sun 5月28日23:59:49 +0000 2017年到太阳5月28日23:59:39 +0000 2017年等等)。我怎么能这样做?
答案 0 :(得分:1)
您可以使用pandas模块通过df = pd.read_json(filename)
从json创建数据框,并使用TimeGrouper对时间间隔grouped = df.groupby(pd.TimeGrouper("10s"))
进行分组。然后,您可以使用for name, group in grouped:
df = pd.read_json(filename)
grouped = df.groupby(pd.TimeGrouper("10s"))
for name, group in grouped:
...