我有一个Jupyter Python笔记本,其数据矩阵包含数据 在SFrame文档中出现某些单词。列名称 是['伟大的','坏',......],每一行都有出现的数量 在列表的不同行上(抱歉,我无法获得 来自VM的截图)。所以行值是非负整数 0,1,2,......
我想创建一个包含2列和11行的矩阵。每行有两个条目: 一个包含每个单词的名称,另一个包含单词的总计数(固定列的所有行的总和)。这些单词是名为“选定单词”的列表的一部分。我有点无能为力, 我知道如何为现有的SFrame创建新列,但不知道如何创建新的SFrame或其他一些Python数据结构。我最好的是:
for word in selected_words:
count[word]=products[word].sum()
print [word, count[word]]
我还想过用其他文件格式创建矩阵并导入它。但后来我不知道如何
任何想法? 感谢。
答案 0 :(得分:0)
我找到的最简单的方法是创建一个Python字典。
' selected_words'是你的单词的Python列表,所以只需迭代每个单词并用每个关键词和出现次数构建dict。
totals = {}
for word in selected_words:
totals[word] = products[word].sum()
然后你可以在IPython中输入totals
,它会为你提供每个单词的字典,并计算它。