所以我目前正试图从推特账号中搜集推文,但我想排除推文,这样我就可以获得200个仅推文数据。目前我有一个工作代码来挖掘数据源,但仍然包含Re-Tweets。我已经建立了排除你需要放的Re-Tweets
代码中的-RT
但我根本不知道在哪里因为我对编程很陌生。
(目前使用Spyder的Python 3.6使用Twitter API for Python(Tweepy)。)
import tweepy
from tweepy import OAuthHandler
import pandas as pd
consumer_key = 'consumer_key'
consumer_secret = 'consumer_secret'
access_token = 'access_token'
access_secret = 'access_secret'
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)
api = tweepy.API(auth)
api = tweepy.API(auth)
screen_name='screen_name'
tweets = api.user_timeline(screen_name, count=200)
save=['']*len(tweets)
for i in range(len(tweets)):
save[i]=tweets[i].text
print(tweets[i].text)
data = pd.DataFrame(save)
data.to_csv("results.csv")
任何人都可以帮助我,最好有完整的部分代码来删除转推。非常感谢你
答案 0 :(得分:0)
当我使用tweepy从Twitter检索推文时,也遇到了同样的问题,对我有用的是我将Twitter的api与内置请求(即http请求)一起使用。 要排除转发,可以在查询参数中传递-RT运算符。
此api的文档。
答案 1 :(得分:0)
在代码中更改此行:
tweets = api.user_timeline(screen_name, count=200)
到以下:
tweets = api.user_timeline(screen_name, count=200, include_rts=False)
此Twitter文档可能会有所帮助:https://developer.twitter.com/en/docs/tweets/timelines/api-reference/get-statuses-user_timeline.html