python twitter crawling_how我可以提取推文日期或推文时间吗?

时间:2017-04-18 12:45:37

标签: python date twitter time web-crawler

现在代码只提取推文的内容。

ex:13703:{'text':'RT @ 11111:嗨嗨嗨嗨~~'}

我想提取推文的日期(2017.04.16)或时间(21:40)。是否可能?

import tweepy
import time
import os
import json
import simplejson

search_term = 'word1'
search_term2= 'word2'
search_term3='word3'

lat = "xxxx"
lon = "xxxx"
radius = "xxxx"
location = "%s,%s,%s" % (lat, lon, radius)

API_key = "xxxx"
API_secret = "xxxx"
Access_token = "xxxx"
Access_token_secret = "xxxx"

auth = tweepy.OAuthHandler(API_key, API_secret)
auth.set_access_token(Access_token, Access_token_secret)

api = tweepy.API(auth)

c=tweepy.Cursor(api.search,
                q="{}+OR+{}".format(search_term, search_term2, search_term3),
                rpp=1000,
                geocode=location,
                include_entities=True)

data = {}
i = 1
for tweet in c.items():
    data['text'] = tweet.text
    print(i, ":", data)
    i += 1
    time.sleep(1)

1 个答案:

答案 0 :(得分:0)

我今天在GitHub上提交了一个机器人TwEater。它可以收集推文的所有可能属性,例如日期,时间,文本,用户名,ID,主题标签,提及,链接,甚至表情符号,以及所有回复的列表等。您甚至可以在过去7天之前收到推文,没有3200条推文限制。去尝试吧,玩得开心!