我很新鲜,我徘徊怎么可能追踪并存储用户在他/她的推文中发布的图像。我在教程中找到了几种获取用户推文的方法,但我找不到只过滤图像的方法。
我使用以下代码来获取用户推文。如何才能获得用户图像?
编辑:我编辑上面的代码:
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(OAUTH_TOKEN, OAUTH_SECRET)
api = tweepy.API(auth)
timeline = api.user_timeline(count=10, screen_name = "zenitiss")
for tweet in timeline:
for media in tweet.entities.get("media",[{}]):
print media
#checks if there is any media-entity
if media.get("type",None) == "photo":
# checks if the entity is of the type "photo"
image_content=requests.get(media["media_url"])
print image_content
然而,似乎for循环它不起作用。打印介质行打印空对象。基本上当我尝试打印用户的网址时,例如karyperry,我得到了:
{u'url': u'http://t.co/TaP2JZrpxu', u'indices': [42, 64], u'expanded_url':
u'http://youtu.be/7bDLIV96LD4', u'display_url': u'youtu.be/7bDLIV96LD4'}
{u'url': u'https://t.co/t3hv7VQiPG', u'indices': [42, 65], u'expanded_url':
u'https://vine.co/v/MgvxZA2qKbV', u'display_url': u'vine.co/v/MgvxZA2qKbV'}
{u'url': u'http://t.co/vnJAAU7KN6', u'indices': [50, 72], u'expanded_url':
u'http://instagram.com/p/n01XZjv-fp/', u'display_url': u'instagram.com/p/n01XZjv-fp/'}
{u'url': u'http://t.co/NycqAwtcgo', u'indices': [78, 100], u'expanded_url':
u'http://bit.ly/1o7xQRj', u'display_url': u'bit.ly/1o7xQRj'}
{u'url': u'http://t.co/BG6ozuRD6D', u'indices': [111, 133], u'expanded_url':
u'http://www.johnnywujek.com/sos', u'display_url': u'johnnywujek.com/sos'}
{u'url': u'http://t.co/nWIQ9ruJ3f', u'indices': [88, 110], u'expanded_url':
u'http://uncf.us/1kSXIwF', u'display_url': u'uncf.us/1kSXIwF'}
{u'url': u'http://t.co/yTbOgqt9fw', u'indices': [101, 123], u'expanded_url':
u'http://instagram.com/p/nvxD8eP-SZ/', u'display_url': u'instagram.com/p/nvxD8eP-SZ/'}
大多数网址都是图片,但是当我把网址放在网址上时而不是媒体'在tweet.entities.get(" url",[{}])的媒体循环中。其中大部分是图片网址。
答案 0 :(得分:5)
推文(他们的JSON表示)包含“媒体”实体,如上所述here。假设推文中包含一个图像,Tweepy应该公开这种类型的实体:
tweet.entities["media"]["media_url"]
因此,如果你想存储图像,你只需要下载它,即。通过python的请求库。尝试在代码中添加以下语句(或根据需要进行修改):
for media in tweet.entities.get("media",[{}]):
#checks if there is any media-entity
if media.get("type",None) == "photo":
# checks if the entity is of the type "photo"
image_content=requests.get(media["media_url"])
# save to file etc.