由于编码问题,苦苦于在tweepy脚本中处理表情符号

时间:2017-08-20 15:07:23

标签: python unicode utf-8 python-2.x tweepy

这让我很伤心,我真的很挣扎......但我和Python有一个相关的问题。

基本上我正试图从csv文件中提取内容到推文。有时这涉及从一组表情符号中挑选:

t4 = function(random_line_from_csv_column_with_emoji)

tweet = t1.decode('utf-8') + " " + t2.decode('utf-8') + " " + t3.decode('utf-8') + " " + t4.decode('utf-8')

return tweet

然后另一个文件使用tweepy流式api从上面的代码中拉出模块的推文,并进行状态更新,例如。

chatResponse = get_the_tweet_above(options)
replyText = '@' + screenName + ' ' + chatResponse
twitterApi.update_status(status=replyText)

大多数情况下,我的代码都有效......但有时它会因编码问题而失败,例如:

'ascii' codec can't encode character u'\U0001f63a' in position 0: ordinal not in range(128)
'ascii' codec can't encode character u'\U0001f943' in position 0: ordinal not in range(128)

那些是表情符号,微笑的猫脸和一些无比的眼镜或不倒翁等......

基本上,我现在正在撕扯我的头发试图找出如何阻止这种情况发生。我总是在Python中遇到编码问题而且从来没有理解它。

如果有人可以通过一些快速简单的答案来完成这项工作,我会非常高兴!

0 个答案:

没有答案