Question

我不知道以下两个代码为何给出不同的结果：

''''''term_frequencies={}
term_frequencies=term_frequencies.fromkeys(final_vocabulary,[])
orgis=term_frequencies
for i in Corpus:
    dic=orgis.fromkeys(orgis,0)
    for k in i:
        if k in final_vocabulary:
            dic[k]+=1
    for x in dic: 
        term_frequencies[x].append(dic[x])''' 



dics={}
for a in final_vocabulary: 
    dics.setdefault(a,[])
origis=dics
for i in Corpus:
    dic=origis.fromkeys(origis,0)
    for s in i:
        if s in final_vocabulary: 
                dic[s]+=1
    for x in dic:
        dics[x].append(dic[x])

我正在尝试为每条评论进行术语频率计数。第一个以某种方式给了我一个非常长的单词列表，每个单词列表中的元素数量比我的评论数量大得多。

我尝试打印代码的每一步，但仍然没有找到原因。让我知道你的想法。

完全相同的代码不同结果Python 3x（调试）

0 个答案: