Question

所以我正在尝试使用这段代码

我在扫描字符串文字时收到错误SyntaxError：EOL

代码：

def clean_tweet(self, tweet):
    '''
    Utility function to clean tweet text by removing links, special characters
    using simple regex statements.
    '''
    return ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])
                                |(\w+:\/\/\S+)", " ", tweet).split())

我错过了什么？

其次，当我运行下面这部分代码时，我得到了错误

TypeError：不支持的操作数类型 - ：'list'和'list'

代码：

 # picking positive tweets from tweets
ptweets = [tweet for tweet in tweets if tweet['sentiment'] == 'positive']
# percentage of positive tweets
print("Positive tweets percentage: {} %".format(100*len(ptweets)/len(tweets)))
# picking negative tweets from tweets
ntweets = [tweet for tweet in tweets if tweet['sentiment'] == 'negative']
# percentage of negative tweets
print("Negative tweets percentage: {} %".format(100*len(ntweets)/len(tweets)))
# percentage of neutral tweets
print("Neutral tweets percentage: {} % \
    ".format(100*len(tweets - ntweets - ptweets)/len(tweets)))
# percentage of neutral tweets
print("Neutral tweets percentage: {} % \
    ".format(100*len(tweets - ntweets - ptweets)/len(tweets)))

是不是因为我试图从列表中减去一个列表，如果是这样，那么numpy会有帮助吗？

Answer 1

专注于：

print("Neutral tweets percentage: {} % \
    ".format(100*len(tweets - ntweets - ptweets)/len(tweets)))

显然tweets，ntweets和ptweets都是列表，因此有长度。然后我想你可以把它重写为：

print("Neutral tweets percentage: {} % \
    ".format(100*(len(tweets) - len(ntweets) - len(ptweets))/len(tweets)))

EOL扫描字符串文字时出错

1 个答案: