用python抓取tweet遇到UnicodeEncodeError

时间:2013-10-09 11:50:10

标签: python json twitter unicode

我试图使用Twittter API和Python

来获取推文的文本

我使用oauth登录并使用以下内容获取结果字典:

jsonTweets = json.loads(response)
list = jsonTweets["statuses"]   # list of dictionaries

type(jsonTweets)  #returns dict
type(list)    #returns list
type(list[0])    #return dict (it's a list of dictionaries)

list [0]是一本字典:

{u'contributors': None, u'truncated': False, u'text': u'RT @Kagame_quotes: "We, the people of #Rwanda, our country has its own problems that we can\u2019t attribute to others, we need to find solution\u2026', u'in_reply_to_status_id': None, u'id': 387905246028394496L, u'favorite_count': 0, u'source': u'<a href="http://twitter.com" rel="nofollow">Twitter Web Client</a>', u'retweeted': False, u'coordinates': None,等......

我只想获取u'text'键的值(即获取推文)

所以我写道:

for item in list:
    print item[u'text']

但这给了我错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019'
in position 91: ordinal not in range(128)

如何获取u'text'键的值?

2 个答案:

答案 0 :(得分:1)

您需要指定UTF-8编码:

for item in list:
    print item[u'text'].encode('utf-8')

这应该可以解决问题。

答案 1 :(得分:0)

你的文字没有错。它只包含unicode字符,你不能在你的consolle上打印。

特别是(查看此http://www.utf8-chartable.de/unicode-utf8-table.pl):

  • U + 2019 RIGHT SINGLE QUALATION MARK
  • U + 2026 HORIZONTAL ELLIPSIS