数据框:
pair = collections.defaultdict(collections.Counter)
e.g。
pair = {'doc1': {'word1':4, 'word2':3},
'doc2': {'word1':2, 'word3':4},
'doc3': {'word2':2, 'word4':1},
...}
我想保留数据框,但要更改此部分的类型{'word1':4, 'word2':3}
{'word1':2, 'word3':4}``...
现在它是Counter
,我需要dict
。
我试过这个来获取pair
的数据,但我不知道如何为每个文档创建dict
:
new_pair = collections.defaultdict(collections.Counter)
for doc, tab in testing.form.items():
for word, freq in tab.items():
new_pair[doc][word] = freq
我不想改变输出。我只需要在每个文档中,数据类型为dict
,而不是Counter
。
答案 0 :(得分:43)
Counter
已经是dict
- 或者是它的子类。但是,如果由于某种原因你真的需要dict
,那么它就是一个单行:
>>> c = Counter(word1=4, word2=3)
>>> c
Counter({'word1': 4, 'word2': 3})
>>> dict(c)
{'word1': 4, 'word2': 3}
任何映射(任何行为类似于字典的行为)都可以传递到dict
,您将获得具有相同内容的dict
。没有必要迭代它来自己构建它。
这给你一个循环,在主体中有一行而不是嵌套循环。但任何形式的代码:
thing = a new empty collection
for elem in old_thing:
Add something to do with elem to thing
通常可以使用生成器表达式或列表,集合或字典理解在一行中完成。我们正在构建dict
,因此dict comprehension(示例部分是您最感兴趣的部分)似乎很可能。我会把它作为读者练习。 ; - )
答案 1 :(得分:0)
也许您正在寻找:
>>> from collections import defaultdict
>>> pair = defaultdict(dict)
>>> pair[3][2]='hello'
>>>
>>> pair
defaultdict(<type 'dict'>, {3: {2: 'hello'}})
>>>
>>> pair[3]
{2: 'hello'}
>>>
答案 2 :(得分:0)
new_pair = {} # simple dict at the top level
for doc, tab in testing.form.items():
for word, freq in tab.items():
# top-level values is word counters
new_pair[doc].setdefault(word, Counter()) += freq
答案 3 :(得分:0)
Counter
也是dict
。但取决于你的需要,也许你想要的是以下代码。
new_pair ={}
for doc, tab in pari.items():
new_pair[doc] = {}
for word, freq in tab.items():
new_pair[doc][word] = freq
你想要的new_pair
字典。祝你好运!
答案 4 :(得分:-2)
将 Counter 对象转换为字典:
from collections import Counter
arr = list(map(int,input().split()))
freq = Counter(arr)
freq = dict(freq)