有没有更好的方法使用python使用twitter API输出文本?

时间:2017-12-28 06:12:35

标签: python python-3.x api twitter

我想使用python3为NLP流式传输twitter,我使用sublime文本(IDLE是相同的结果),但是有很多非'utf-8'字符,如下所示:

NPP(\ u0e19 \ u0e31 \ u0e01 \ u0e1e \ u0e39 \ u0e14 \ u0e40 \ u0e2b} \ n \ n \ u0e35 \ u0e49 \ u0e22)\ u0e40 \ u0e16 \ u0e2d \ u0e30 \ u0e44 \ u0e2d \ u0e49 \ u0e1b \ u0e4a \ u0e2d \ u0e1b \ u0e04 \ u0e14 \ u0e35 \ u0e40 \ u0e01 \ u0e48 \ u0e32 \ u0e17 \ u0e35 \ u0e48 \ u0e44 \ u0e25 \ u0e40 \ u0e40 \ u0e49 \ u0e40 \ u0e04 \ u0e32 \ u0e44 \ u0e1b \ u0e15 \ u0e22 \ u0e22 \ u0e2d \ u0e48 \ u0e30 \ u0e21 \ u0e36 \ u0e07 \ u0e40 \ u0e04 \ u0e25 \ u0e35 \ u0e22 \ u0e23 \ u0e4c \ u0e22 \ u0e31 \ u0e07 \ u0e2a \ u0e31 \ u0e14 \ u0e21 \ u0e32 \ u0e2a \ u0e40 \ u0e15 \ u0e2d \ u0e23 \ u0e4c \ u0e04 \ u0e27 \ u0e22 \ u0e44 \ u0e23 \ u0e21 \ u0e32 \ u0e2a \ u0e40 \ u0e15 \ u0e2d \ u0e23 \ u0e4c \ u0e2d \ u0e32 \ u0e23 \ u0e4c \ u0e15 \ u0e2a \ u0e35 \ U2026"

我的节目是:

from tweepy import Stream
from tweepy import OAuthHandler
from tweepy.streaming import StreamListener
import time
ckey=""
csecret=""
atoken=""
asecret=""

class listener(StreamListener):

    def on_data(self, data):
        try:
            # print(data)



            tweet=data.split(',')[3].split('"text":')[1].split(':')[1]
            print(tweet)

            saveThis=str(time.time())+'::'+tweet
            saveFile=open('twitdb.csv','a')
            saveFile.write(tweet)
            # saveFile.write(data)
            saveFile.write('\n')
            saveFile.close()
            return True

        except BaseException as e:
            print('failed ondata,',str(e))
            time.sleep(5)

    def on_error(self, status):
        print(status)

auth = OAuthHandler(ckey, csecret)
auth.set_access_token(atoken, asecret)

twitterStream = Stream(auth, listener())
twitterStream.filter(track=["NLP"])
谁可以帮助我?谢谢

0 个答案:

没有答案