我一直致力于从文件列表中查找每个文件的总tf-idf值。到目前为止,我已经计算了每个文件中所有单词的tf-idf值(在for w in words
内)。现在我想添加每个单词的tf-idf值,最终给出特定文件f
的tf-idf值,并将文件的tf-idf值写入文本文件。我在Python方面有点新,我在这方面遇到了一些问题。任何建议都将受到高度赞赏。
for f in file_list:
(some code)
for w in words:
(some code)
tf_idf = tf_value * idf_value
答案 0 :(得分:0)
如果您想要文件tf_idf
中所有字词w
的总f
,那么您可以进行以下简单更改:
for f in file_list:
(some code)
tf_idf = 0 # (re)set value for new file
for w in words:
(some code)
tf_idf += (tf_value * idf_value) # add to running total
print tf_idf # total for file f
至于将结果添加到新文件,请启动here。