无法使用BeautifulSoup

时间:2015-12-28 15:09:50

标签: python python-2.7 parsing twitter beautifulsoup

我试图检索推文的数量。我发现用户推文的实际数量在隐藏字段中。

enter image description here

其中,我正在使用BeautifulSoup解析:

def get_twitter(url):
  soup = BeautifulSoup(urllib2.urlopen(url))
  for match in soup.find_all("input", type="hidden"):
    print match

结果: [enter image description here 2

正如您所看到的,您可以在浏览器的屏幕截图中找到隐藏的输入字段。为什么会这样?

1 个答案:

答案 0 :(得分:1)

解决。使用的twitter API。不知何故认为解析会更容易。感谢alecxe的建议。

import simplejson
from twython import Twython

def get_twitter():
    t = Twython(app_key='', 
    app_secret='',
    oauth_token='',
    oauth_token_secret='')

    user = t.lookup_user(screen_name = username)
    print "Tweets: " + str(user[0]['statuses_count'])
    print "Followers: " + str(user[0]['followers_count'])
    print "Likes: " + str(user[0]['favourites_count'])