我有一个字典的Python字典,用于模拟一组文档中单词的TF-IDF权重。像那样:
Corpus_dict = {" Doc1.txt":{' word1':XXXX,' word2':XXXX,...,wordn:xxx}
" Doc2.txt":{' word1':XXXX,' word2':XXXX,...,wordn:xxx}
...
" Docm.txt":{' word1':XXXX,' word2':XXXX,...,wordn:xxx}}
其中xxx是n个单词中每个单词的TF-IDF值。我想将其转换为以下的熊猫数据框:
keys Doc1 Doc2 ... Docn
word1 xxx xxx xxx
word2 xxx xxx xxx
...
word nxxx xxx xxx
有人可以给我一些帮助吗?
抱歉英语不好,谢谢!
答案 0 :(得分:2)
答案 1 :(得分:0)