获取Bios中具有某些单词的所有Twitter用户配置文件列表

时间:2014-03-06 14:23:41

标签: python twitter tweepy

大家好我正在尝试做一个研究项目,我试图拉动所有Twitter用户档案(或者至少是他们的一些子集用户)。

从提取这些数据开始,我想将所有用户的bios或description字段中包含某些单词或单词存储在文件中。

这是我提出的并且一直在尝试使用的代码:

import tweepy
import csv

ckey ='...'
csecret ='...'
atoken = '...'
asecret = '...'

# Attributes of a twitter user profile (this header is already on my file)
twitter_datafile_attr = ['follow_request_sent', 'profile_use_background_image',       'contributors_enabled', 'id', 'verified', 
                       'profile_image_url_https', 'profile_sidebar_fill_color', 'profile_text_color', 'followers_count', 
                       'profile_sidebar_border_color', 'id_str', 'default_profile_image', 'listed_count' 'is_translation_enabled', 
                       'utc_offset', 'statuses_count', 'description', 'friends_count', 'location', 'profile_link_color', 
                       'profile_image_url', 'notifications', 'geo_enabled', 'profile_background_color', 'profile_banner_url', 
                       'profile_background_image_url', 
                       'screen_name', 'lang', 'following', 'profile_background_tile', 'favourites_count', 'name', 'url', 'created_at', 
                       'profile_background_image_url_https', 'time_zone', 'protected', 'default_profile', 'is_translator']

#Authencation
auth = tweepy.OAuthHandler(ckey,csecret)
auth.set_access_token(atoken,asecret)
api=tweepy.API(auth)
# search for people who have both the words "hawaii and "water" anywhere in their bios
user=api.search('hawaii water')

这是我被困的地方,我试图使用get_user(ctr),其中ctr通过twitter id迭代到一定数量的用户。将数据处理成csv文件很简单我已经为它实现了代码。

我应该在twitter.com上进行手动搜索并查看源代码文件并使用正则表达式解析数据,还是使用tweepy获取用户配置文件匹配其bios中的某些单词?

任何帮助将不胜感激。感谢

1 个答案:

答案 0 :(得分:2)

我能够自己找到。

您使用api.search_users(查询)来搜索与特定查询匹配的用户名。