Question

     Values          
0   99;3;;Sicherheitstür (0SS4.2) bei Anfang Boxen...
1   100;3;;Sicherheitstür (0SS4.2) bei Anfang Boxe...
3   145;3;;Sicherheitstür (0SS3b.5) bei Einspeisef...
4   95;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
5   96;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
6   30;3;;Anlage ausgeschaltet (Schlüsselschalter ...
7   37;3;;Sicherheitsbereich 5 (Paketierung) ausge...
12  1400;2;;Entladeförderer (Pos. 730) -Handbetrie...
13  1404;2;;Stauförderer 2 (Pos. 1130) -Handbetrie...
14  1401;2;;Bretterzerteiler (Pos. 1060) -Handbetr...
15  1431;2;;Stauförderer 2 (Pos. 1130) -Handbetrie...
17  1402;2;;Ausrichtrollgang (Pos. 1110) -Handbetr...
18  1403;2;;Stauförderer 1 (Pos. 1120) -Handbetrie...
19  1406;2;;Lagenklemmung (Pos. 1140) -Handbetrieb...
20  1402;2;;Ausrichtrollgang (Pos. 1110) -Handbetr..

df每个列有很多不同的值我想将每列中最常用的字符串后的df分组，并将字符串及其频率存储到字典中


{Sicherheitstür: 5, Ausrichtrollgang: 2, ....

到目前为止，我只能以简单的形式对df进行分组

df_new = df.groupby(['a']).groups

Answer 1

new_data = df["a"].value_counts().to_dict()

Answer 2

您可以使用以下方法构建字典：

mydict = df["a"].value_counts().to_dict()

这将为您提供单词和单词计数，然后可以使用以下命令对其进行排序：

for key in sorted(mydict):
    print "%s: %s" % (key, mydict[key])

或者：

from collections import OrderedDict
ordereddict = OrderedDict(sorted(mydict.items(), key=lambda t: t[0]))

有关排序的更多方法，请查看here。

对于一个更常见的问题，您可以看看here。

在al栏中找到最常见的字符串

2 个答案: