我正在创建一个项目,我将收到推文列表(Twitter),然后检查dictionary
内是否包含某些值的单词。我已经拿到了我的代码来接受这些话,但我不知道如何消除像, . "
这样的符号:
以下是代码:
def getTweet(tweet, dictionary):
score = 0
seperate = tweet.split(' ')
print seperate
print "------"
if(len(tweet) > 0):
for item in seperate:
if item in dictionary:
print item
score = score + int(dictionary[item])
print "here's the score: " + str(score)
return score
else:
print "you haven't tweeted a tweet"
return 0
这是将要检查的参数/推文:
getTweet("you are the best loyal friendly happy cool nice", scoresDict)
有什么想法吗?
答案 0 :(得分:1)
如果您想要删除所有非字母数字值,您可以尝试:
import re
re.sub(r'[^\w]', ' ', string)
旗帜[^ \ w]会为你做的伎俩!
答案 1 :(得分:0)
在进行拆分之前,请用空格替换字符,然后拆分空格。
import re
line = ' a.,b"c'
line = re.sub('[,."]', ' ', line)
print line # ' a b c'