所以我正在尝试使用这段代码
我在扫描字符串文字时收到错误SyntaxError:EOL
代码:
def clean_tweet(self, tweet):
'''
Utility function to clean tweet text by removing links, special characters
using simple regex statements.
'''
return ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])
|(\w+:\/\/\S+)", " ", tweet).split())
我错过了什么?
其次,当我运行下面这部分代码时,我得到了错误
TypeError:不支持的操作数类型 - :'list'和'list'
代码:
# picking positive tweets from tweets
ptweets = [tweet for tweet in tweets if tweet['sentiment'] == 'positive']
# percentage of positive tweets
print("Positive tweets percentage: {} %".format(100*len(ptweets)/len(tweets)))
# picking negative tweets from tweets
ntweets = [tweet for tweet in tweets if tweet['sentiment'] == 'negative']
# percentage of negative tweets
print("Negative tweets percentage: {} %".format(100*len(ntweets)/len(tweets)))
# percentage of neutral tweets
print("Neutral tweets percentage: {} % \
".format(100*len(tweets - ntweets - ptweets)/len(tweets)))
# percentage of neutral tweets
print("Neutral tweets percentage: {} % \
".format(100*len(tweets - ntweets - ptweets)/len(tweets)))
是不是因为我试图从列表中减去一个列表,如果是这样,那么numpy会有帮助吗?
答案 0 :(得分:1)
专注于:
print("Neutral tweets percentage: {} % \
".format(100*len(tweets - ntweets - ptweets)/len(tweets)))
显然tweets
,ntweets
和ptweets
都是列表,因此有长度。然后我想你可以把它重写为:
print("Neutral tweets percentage: {} % \
".format(100*(len(tweets) - len(ntweets) - len(ptweets))/len(tweets)))