我正在尝试使用pandas.Series.value_counts来获取数据帧中值的频率,因此我遍历每一列并获取values_count,这给了我一个系列:
我正在努力将这个结果系列转换成dict:
groupedData = newData.groupby('class')
for k, group in groupedData:
dictClass[k] = {}
for eachlabel in dataLabels:
myobj = group[eachlabel].value_counts()
for eachone in myobj:
print type(myobj)
print myobj
我需要的是一个字典:
{' high':3909,'平均':3688,' less':' 182,'非常' :62}
答案 0 :(得分:26)
如果您想将Series
转换为dict
,可以致电dict
或.to_dict()
:
>>> s
high 3909
average 3688
less 182
veryless 62
dtype: int64
>>> type(s)
<class 'pandas.core.series.Series'>
>>> dict(s)
{'high': 3909, 'average': 3688, 'veryless': 62, 'less': 182}
>>> s.to_dict()
{'high': 3909, 'average': 3688, 'veryless': 62, 'less': 182}
答案 1 :(得分:0)
values = df['your_column'].value_counts(dropna=False).keys().tolist()
counts = df['your_column'].value_counts(dropna=False).tolist()
value_dict = dict(zip(values, counts))