使用Twitter数据重新取样函数抛出错误

时间:2015-10-16 16:43:02

标签: python twitter pandas

我有一些推特数据

int dummy=intVar_B

然后我想将这些数据重新整理成一个时间序列来分析每分钟的推文。我首先验证了TweetCreated'是日期时间格式:

tweetText   tweetSource      tweetCreated
#Tweet...   TwitterforAND    2015-10-15 06:52:34
#Tweet...   TwitterforAND    2015-10-15 06:52:34
#Tweet...   TwitterforiPH    2015-10-15 06:52:34  

为了确保我将tweetCreated格式化为datetime

df.tweetCreated.dtypes()
ln[1] tweetCreated       datetime64[ns]

然后我尝试重新采样以进行分析

 df["tweetCreated"] = pd.to_datetime(df["tweetCreated"], unit='s')

并收到以下错误

rs= df['tweetCreated'].resample('1t', how='count')

但是我可以从我的dtypes分析中清楚地看到tweetCreated是datetime。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

如果您要使用tweetCreated,则resample()已创建的列必须是您正在使用的数据帧的索引。

您可以df.set_index(['tweetCreated'], inplace=True)

执行此操作