我不知道以下两个代码为何给出不同的结果:
''''''term_frequencies={}
term_frequencies=term_frequencies.fromkeys(final_vocabulary,[])
orgis=term_frequencies
for i in Corpus:
dic=orgis.fromkeys(orgis,0)
for k in i:
if k in final_vocabulary:
dic[k]+=1
for x in dic:
term_frequencies[x].append(dic[x])'''
dics={}
for a in final_vocabulary:
dics.setdefault(a,[])
origis=dics
for i in Corpus:
dic=origis.fromkeys(origis,0)
for s in i:
if s in final_vocabulary:
dic[s]+=1
for x in dic:
dics[x].append(dic[x])
我正在尝试为每条评论进行术语频率计数。 第一个以某种方式给了我一个非常长的单词列表,每个单词列表中的元素数量比我的评论数量大得多。
我尝试打印代码的每一步,但仍然没有找到原因。让我知道你的想法。