Question

我是python的新手，希望你能帮我解决这个问题，我正在使用python 3.4。

我有一个包含单词的列表，无论是正面还是负面，还有它的频率

这是原始列表：

finalSentiment = [（＆＃39;被劫持＆＃39;，＆＃39;否定＆＃39;），（＆＃39;被劫持＆＃39;，＆＃39;肯定＆＃39;），（＆＃39;劫持＆＃39;，＆＃39;否定＆＃39;），（＆＃39;劫持＆＃39;，＆＃39;负面＆＃39;），（＆＃39;劫持＆＃39;，＆＃39;消极的＆＃39;），...（＆＃39; dem＆＃39;，＆＃39;肯定＆＃39;）（＆＃39; dem＆＃39;，＆＃39;消极＆＃39;）

我要做的是从我所拥有的列表中计算每个单词的正数和负数。因此，如果负数的数字较高，则该字为负数。然后我可以提出一个新列表，如：例如：newList = [（＆＃39; hijacked＆＃39;，＆＃39; negative＆＃39;），（＆＃39; left＆＃39;，＆＃39; negative＆＃39;）,. 。。]

a）我尝试使用num = Count（finalSentiment）.most_common（）[：50]函数，并出现如下新列表。

num = [（（＆＃39;被劫持＆＃39;，＆＃39;否定＆＃39;），302），（（＆＃39;左＆＃39;，＆＃39;否定＆＃39;），88，（（＆＃39;一个＆＃39;，＆＃39;否定＆＃39;），79），（（＆＃39; befo＆＃39;，＆＃39;消极＆＃39;），72 ），（（＆＃39;激进＆＃39;，＆＃39;否定＆＃39;），70），（（＆＃39; tcot＆＃39;，＆＃39;否定＆＃39;），70），（（＆＃39;油轮＆＃39;，＆＃39;否定＆＃39;），55），（（＆＃39;喜欢＆＃39;，＆＃39;负＆＃39;），47），（（＆＃39;对＆＃39;，＆＃39;否定＆＃39;），36），（（＆＃39;石油＆＃39;，＆＃39;否定＆＃39;），26），（＆＃ 39;劫持＆＃39;，＆＃39;肯定＆＃39;），22），（（＆＃39;海盗＆＃39;，＆＃39;负面＆＃39;），21），（＆＃39;人民＆＃39;，＆＃39;否定＆＃39;），21），（（＆＃39;恐怖主义＆＃39;，＆＃39;消极＆＃39;），21），（＆＃39; loony＆＃ 39;，＆＃39;否定＆＃39;），18），（（＆＃39;蠢货＆＃39;，＆＃39;消极＆＃39;），18），（（＆＃39; get＆＃39; ，＆＃39;否定＆＃39;），17），（（＆＃39;帐号＆＃39;，＆＃39;否定＆＃39;），12），（（＆＃39; flag＆＃39;，＆＃39;否定＆＃39;），11），（（＆＃39;时间＆＃39;，＆＃39;否定＆＃39;），10），（（＆＃39;愤怒＆＃39;，＆＃39; ;否定＆＃39;），9），（（＆＃39;喜欢＆＃39;，＆＃39;肯定＆＃39;），8，（（＆＃39; day＆＃39;，＆＃39; negative＆＃39;），8），（（＆＃39; know＆＃39;，＆＃39; negative＆＃39;），8 ），（（＆＃39; dem＆＃39;，＆＃39;否定＆＃39;），7），（（＆＃39;油轮＆＃39;，＆＃39;肯定＆＃39;），7），（（＆＃39;长＆＃39;，＆＃39;否定＆＃39;），6），（（＆＃39;左＆＃39;，＆＃39;肯定＆＃39;），6），（（＆＃39; driver＆＃39;，＆＃39; negative＆＃39;），6），（（＆＃39; one＆＃39;，＆＃39; positive＆＃39;），6），（＆＃ 39;得到＆＃39;，＆＃39;），6），（（＆＃39; tcot＆＃39;，＆＃39;肯定＆＃39;），5），（＆＃39;激进的＆＃39;，＆＃39;积极＆＃39;），5），（（＆＃39; befo＆＃39;，＆＃39;积极的＆＃39;），5），（（＆＃39;海盗＆＃ 39;，＆＃39;肯定＆＃39;），3），（（＆＃39;生活＆＃39;，＆＃39;消极＆＃39;），3），（（＆＃39; oil＆＃39; ，＆＃39;肯定＆＃39;），2），（（＆＃39;时间＆＃39;，＆＃39;肯定＆＃39;），2），（（＆＃39; pay＆＃39;，＆＃39;否定＆＃39;），2），（（＆＃39;无＆＃39;，＆＃39;肯定＆＃39;），1），（（＆＃39;人＆＃39;，＆＃39; ;积极＆＃39;），1），（（＆＃39;蠢货＆＃39;，＆＃39;积极＆＃39;），1），（（＆＃39;长＆＃39;，＆＃39;积极＆＃39;），1），（（＆＃39;帐号＆＃39;，＆＃39;肯定＆＃39;），1），（（＆＃39; mt＆＃39;，＆＃39;消极＆＃39; ）， 1），（（＆＃39;得到＆＃39;，＆＃39;肯定＆＃39;），1），（（＆＃39; day＆＃39;，＆＃39; positive＆＃39;），1），（（＆＃39; loony＆＃39;，＆＃39;肯定＆＃39;），1），（（＆＃39;知道＆＃39;，＆＃39;肯定＆＃39;），1），（（＆＃39;父亲＆＃39;，＆＃39;否定＆＃39;），1）]

我想要做的是比较单词频率正面或负面更高。因此，如果负数较高，我想创建一个包含单词和负数的新列表。

例如：[（＆＃39;被劫持＆＃39;，＆＃39;否定＆＃39;），（＆＃39;左＆＃39;，＆＃39;否定＆＃39;）,. 。。]

每个单词在列表中只有正面或负面。

我尝试的是尝试使用for循环访问列表中的每个项目。

表示num：

中的项目

    unique_word = item[0]
    temp = unique_word[0]
    temp1 = unique_word[1]
    frequency = item[1]

但我无法弄清楚在访问数据后如何操作数据。

b）我使用counter（）函数并列出这个列表：

cnt = Counter（）在finalSentiment中的单词： cnt [word] + = 1 打印（CNT）

结果：计数器（{（＆＃39;被劫持＆＃39;，＆＃39;否定＆＃39;）：302，（＆＃39;左＆＃39;，＆＃39;否定＆＃39;）： 88，（＆＃39; one＆＃39;，＆＃39; negative＆＃39;）：79，（＆＃39; befo＆＃39;，＆＃39; negative＆＃39;）：72，（＆＃39;） ; tcot＆＃39;，＆＃39;否定＆＃39;）：70，（＆＃39;激进＆＃39;，＆＃39;负面＆＃39;）：70，（＆＃39;油轮＆＃39;，＆＃39;否定＆＃39;）：55，（＆＃39;喜欢＆＃39;，＆＃39;否定＆＃39;）：47，（＆＃39;右＆＃39;，＆＃39;否定＆＃ 39;）：36，（＆＃39;油＆＃39;，＆＃39;否定＆＃39;）：26，（＆＃39;被劫持＆＃39;，＆＃39;肯定＆＃39;）：22，（＆＃39;海盗＆＃39;负面＆＃39;）：21，（＆＃39;恐怖主义＆＃39;，＆＃39;否定＆＃39;）：21，（＆＃39;人＆＃39;，＆＃39;否定＆＃39;）：21，（＆＃39;蠢货＆＃39;，＆＃39;否定＆＃39;）：18，（＆＃39; loony＆＃39;，＆＃ 39;否定＆＃39;）：18，（＆＃39;得到＆＃39;，＆＃39;否定＆＃39;）：17，（＆＃39;帐号＆＃39;，＆＃39;否定＆＃39; ）：12，（＆＃39; flag＆＃39;，＆＃39; negative＆＃39;）：11，（＆＃39; time＆＃39;，＆＃39; negative＆＃39;）：10，（＆＃39;愤怒＆＃39;，＆＃39;否定＆＃39;）：9，（＆＃39;喜欢＆＃39;，＆＃39;肯定＆＃39;）：8，（＆＃39; day＆＃39;） ;，＆＃39;否定e＆＃39;）：8，（＆＃39;知道＆＃39;，＆＃39;否定＆＃39;）：8，（＆＃39; dem＆＃39;，＆＃39;否定＆＃39;）： 7，（＆＃39;油轮＆＃39;，＆＃39;肯定＆＃39;）：7，（＆＃39;得到＆＃39;，＆＃39;否定＆＃39;）：6，（＆＃39;） ;左边＆＃39;，＆＃39;肯定＆＃39;）：6，（＆＃39;一个＆＃39;，＆＃39;肯定＆＃39;）：6，（＆＃39;驱动程序＆＃39;，＆＃39;否定＆＃39;）：6，（＆＃39;长＆＃39;，＆＃39;否定＆＃39;）：6，（＆＃39;激进＆＃39;，＆＃39;肯定＆＃39; 39;）：5，（＆＃39; befo＆＃39;，＆＃39;肯定＆＃39;）：5，（＆＃39; tcot＆＃39;，＆＃39;肯定＆＃39;）：5，（＆＃39;海盗＆＃39;肯定＆＃39;）：3，（＆＃39;生活＆＃39;，＆＃39;消极＆＃39;）：3，（＆＃39;时间＆＃39;，＆＃39;肯定＆＃39;）：2，（＆＃39;支付＆＃39;，＆＃39;消极＆＃39;）：2，（＆＃39;石油＆＃39;，＆＃ 39;积极＆＃39;）：2，（＆＃39; mt＆＃39;，＆＃39;否定＆＃39;）：1，（＆＃39; loony＆＃39;，＆＃39;肯定＆＃39; ）：1，（＆＃39; morons＆＃39;，＆＃39; positive＆＃39;）：1，（＆＃39; long＆＃39;，＆＃39; positive＆＃39;）：1，（＆＃39;得到＆＃39;，＆＃39;肯定＆＃39;）：1，（＆＃39;遗憾地＆＃39;，＆＃39;消极＆＃39;）：1，（＆＃39; day＆＃39;） ;，＆＃39;肯定＆＃39;）：1，（＆＃39;无＆＃39;，＆＃39;肯定＆＃39;）：1，（＆＃39;父亲＆＃39;，＆＃39;否定＆＃39;）：1，（＆＃39;帐号＆＃39;，＆＃39;肯定＆＃39;）：1，（＆＃39;马来西亚＆＃39;，＆＃39;否定＆＃39;）：1，（＆＃39;右＆＃39;，＆＃39;肯定＆＃39;）：1，（＆＃39;人＆＃39;，＆＃ 39;肯定＆＃39;）：1，（＆＃39;知道＆＃39;，＆＃39;肯定＆＃39;）：1，（＆＃39;看＆＃39;，＆＃39;肯定＆＃39; ）：1}）

我现在遇到的问题是比较“被劫持”这个词的例子，负数高于新列表中的“被劫持”字样。应该是否定的，这样：例如：newList = [（＆＃39; hijacked＆＃39;，＆＃39; negative＆＃39;），（＆＃39; left＆＃39;，＆＃39; negative＆＃39;）,. 。。]

c）或者我可能应该自己计算正数和负数，而不是使用most_common（）函数或counter（）。我计算正负数的问题是因为列表中有多个单词。如果这个词只被“劫持”。正面和负面附加我认为我可以解决问题。

Answer 1

with open("file1.txt", "rt") as finp:
    with open("file2.txt", "wt") as fout:
        for line in finp.readlines():
            if line.startswith("#####") or line.startswith("* [x]"):
                fout.write(line)

您可以通过从列表中创建字典并比较键和值来尝试这样的事情。

比较python列表

1 个答案: