如何在Python中比较多个列表中的字符串?

时间:2018-01-16 18:33:45

标签: python string twitter counter canopy

我有一个Twitter应用程序可以梳理关于趋势主题的推文。 它生成一个.txt文件(称为“单词”),将所有推文中的每个单词解析为列表中的字符串。

目前,为了将推特列表中的每个单词与“正面”单词列表进行比较,我有:

def p_count(l): #list of strings is object called upon
    total = 0
    for w in l: #for each word in twitter 'words' list
        for x in p_words: #for each word in "positive" words list
            if w == x: #compare twitter word to x positive word
                total += 1
    return total
print p_count(words)

我得到0的结果,但是我知道两个列表中都出现了'谦虚'和'强'这样的词。我正在使用Enthought Canopy。有什么提示吗?

1 个答案:

答案 0 :(得分:0)

您的代码看起来很好。

问题可能与您的文本文件有关。

当您从文本文件中检索单词时,Python可以保存末尾带有'\ 0'或'\ n'的单词。这可能是你的言辞不平等的原因。

另一个原因可能与大写字母,标点符号,空格等有关......

你最好的选择是打印'w'和'x'。这样你就可以很容易地看出它们不匹配的原因。

希望这会对你有所帮助。