Question

我有一个Twitter应用程序可以梳理关于趋势主题的推文。它生成一个.txt文件（称为“单词”），将所有推文中的每个单词解析为列表中的字符串。

目前，为了将推特列表中的每个单词与“正面”单词列表进行比较，我有：

def p_count(l): #list of strings is object called upon
    total = 0
    for w in l: #for each word in twitter 'words' list
        for x in p_words: #for each word in "positive" words list
            if w == x: #compare twitter word to x positive word
                total += 1
    return total
print p_count(words)

我得到0的结果，但是我知道两个列表中都出现了'谦虚'和'强'这样的词。我正在使用Enthought Canopy。有什么提示吗？

Answer 1

您的代码看起来很好。

问题可能与您的文本文件有关。

当您从文本文件中检索单词时，Python可以保存末尾带有'\ 0'或'\ n'的单词。这可能是你的言辞不平等的原因。

另一个原因可能与大写字母，标点符号，空格等有关......

你最好的选择是打印'w'和'x'。这样你就可以很容易地看出它们不匹配的原因。

希望这会对你有所帮助。

如何在Python中比较多个列表中的字符串？

1 个答案: