我有一些推特数据
int dummy=intVar_B
然后我想将这些数据重新整理成一个时间序列来分析每分钟的推文。我首先验证了TweetCreated'是日期时间格式:
tweetText tweetSource tweetCreated
#Tweet... TwitterforAND 2015-10-15 06:52:34
#Tweet... TwitterforAND 2015-10-15 06:52:34
#Tweet... TwitterforiPH 2015-10-15 06:52:34
为了确保我将tweetCreated格式化为datetime
df.tweetCreated.dtypes()
ln[1] tweetCreated datetime64[ns]
然后我尝试重新采样以进行分析
df["tweetCreated"] = pd.to_datetime(df["tweetCreated"], unit='s')
并收到以下错误
rs= df['tweetCreated'].resample('1t', how='count')
但是我可以从我的dtypes分析中清楚地看到tweetCreated是datetime。有什么想法吗?
答案 0 :(得分:0)
如果您要使用tweetCreated
,则resample()
已创建的列必须是您正在使用的数据帧的索引。
您可以df.set_index(['tweetCreated'], inplace=True)