我有一个Twitter应用程序可以梳理关于趋势主题的推文。 它生成一个.txt文件(称为“单词”),将所有推文中的每个单词解析为列表中的字符串。
目前,为了将推特列表中的每个单词与“正面”单词列表进行比较,我有:
def p_count(l): #list of strings is object called upon
total = 0
for w in l: #for each word in twitter 'words' list
for x in p_words: #for each word in "positive" words list
if w == x: #compare twitter word to x positive word
total += 1
return total
print p_count(words)
我得到0的结果,但是我知道两个列表中都出现了'谦虚'和'强'这样的词。我正在使用Enthought Canopy。有什么提示吗?
答案 0 :(得分:0)
您的代码看起来很好。
问题可能与您的文本文件有关。
当您从文本文件中检索单词时,Python可以保存末尾带有'\ 0'或'\ n'的单词。这可能是你的言辞不平等的原因。
另一个原因可能与大写字母,标点符号,空格等有关......
你最好的选择是打印'w'和'x'。这样你就可以很容易地看出它们不匹配的原因。
希望这会对你有所帮助。