我想使用python3为NLP流式传输twitter,我使用sublime文本(IDLE是相同的结果),但是有很多非'utf-8'字符,如下所示:
NPP(\ u0e19 \ u0e31 \ u0e01 \ u0e1e \ u0e39 \ u0e14 \ u0e40 \ u0e2b} \ n \ n \ u0e35 \ u0e49 \ u0e22)\ u0e40 \ u0e16 \ u0e2d \ u0e30 \ u0e44 \ u0e2d \ u0e49 \ u0e1b \ u0e4a \ u0e2d \ u0e1b \ u0e04 \ u0e14 \ u0e35 \ u0e40 \ u0e01 \ u0e48 \ u0e32 \ u0e17 \ u0e35 \ u0e48 \ u0e44 \ u0e25 \ u0e40 \ u0e40 \ u0e49 \ u0e40 \ u0e04 \ u0e32 \ u0e44 \ u0e1b \ u0e15 \ u0e22 \ u0e22 \ u0e2d \ u0e48 \ u0e30 \ u0e21 \ u0e36 \ u0e07 \ u0e40 \ u0e04 \ u0e25 \ u0e35 \ u0e22 \ u0e23 \ u0e4c \ u0e22 \ u0e31 \ u0e07 \ u0e2a \ u0e31 \ u0e14 \ u0e21 \ u0e32 \ u0e2a \ u0e40 \ u0e15 \ u0e2d \ u0e23 \ u0e4c \ u0e04 \ u0e27 \ u0e22 \ u0e44 \ u0e23 \ u0e21 \ u0e32 \ u0e2a \ u0e40 \ u0e15 \ u0e2d \ u0e23 \ u0e4c \ u0e2d \ u0e32 \ u0e23 \ u0e4c \ u0e15 \ u0e2a \ u0e35 \ U2026"我的节目是:
from tweepy import Stream
from tweepy import OAuthHandler
from tweepy.streaming import StreamListener
import time
ckey=""
csecret=""
atoken=""
asecret=""
class listener(StreamListener):
def on_data(self, data):
try:
# print(data)
tweet=data.split(',')[3].split('"text":')[1].split(':')[1]
print(tweet)
saveThis=str(time.time())+'::'+tweet
saveFile=open('twitdb.csv','a')
saveFile.write(tweet)
# saveFile.write(data)
saveFile.write('\n')
saveFile.close()
return True
except BaseException as e:
print('failed ondata,',str(e))
time.sleep(5)
def on_error(self, status):
print(status)
auth = OAuthHandler(ckey, csecret)
auth.set_access_token(atoken, asecret)
twitterStream = Stream(auth, listener())
twitterStream.filter(track=["NLP"])
谁可以帮助我?谢谢