我有以下代码,它能够为每个wordQ1
提供文档频率,现在我需要TF
(wordQ1
的{{1}}一词每个文档TF
)和每个DocID
的{{1}}。
数据结构如下:
DocSize
我的输出应如下所示:
文件999中的乔治术语频率为5
DocID
非常感谢您的帮助
答案 0 :(得分:0)
您可以通过更改循环内容的方式来获取内部词典中的值。用以下内容替换for i in d.keys()
循环:
for DocID, (TF, DocSize) in d.items():
# ...
您实际上没有解释您要对TF
和DocSize
值做什么,所以我已经将循环的实际内容留给了您。
请注意,这里需要一个循环有点傻。如果您正在创建正在处理的数据结构(而不是从某个外部源获取),您应该将其设计更改为单个字典(在此级别)而不是字典列表,每个字典都包含一把钥匙。也就是说,您将摆脱数据结构的Term_List1
级别,并在此时直接获得d
。