我需要将这两个推文数据集合并为一个变量。变量需要有两个"列,"一个用于推文的文本,另一个用于源的二进制指示符(例如,第一个源为0,第二个源为1)。我可以使用元组列表或Pandas数据帧。我是编码新手,所以我不知道如何继续。我知道我可以创建两个词典并将它们组合起来,但不确定如何添加包含二进制指示符的列。这就是我现在所处的位置:
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth, wait_on_rate_limit=True, wait_on_rate_limit_notify=True)
userNRA = api.get_user("NRA")
userCSGV = api.get_user("CSGV")
c_nra = tweepy.Cursor(api.user_timeline, id="NRA")
NRAtweet_store = []
for status in c_nra.items(500):
NRAtweet_store.append(status.text)
c_csgv = tweepy.Cursor(api.user_timeline, id="CSGV")
CSGVtweet_store = []
for status in c_csgv.items(500):
CSGVtweet_store.append(status.text)
答案 0 :(得分:2)
不是仅附加文本,而是附加文本和标记:
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth, wait_on_rate_limit=True, wait_on_rate_limit_notify=True)
userNRA = api.get_user("NRA")
userCSGV = api.get_user("CSGV")
tweets = []
c_nra = tweepy.Cursor(api.user_timeline, id="NRA")
for status in c_nra.items(500):
tweets.append((status.text, 0))
c_csgv = tweepy.Cursor(api.user_timeline, id="CSGV")
for status in c_csgv.items(500):
tweets.append((status.text, 1))
这将为您留下一个元组列表,每个元组中的第二个条目指示第一个条目的来源。