何我可以在数据帧的列中提取出现特定时间的元素? 我设法使用以下公式获得每个元素的频率:
df['Column_name'].value_counts()
但是现在我想在控制台中显示在数据帧列中出现特定时间的元素列表。
答案 0 :(得分:0)
这是一个解决方案。它使用collections.defaultdict
并简单地迭代pd.Series.value_counts
系列输出,反转映射。
from collections import defaultdict
d = defaultdict(list)
for k, v in df['Column_name'].value_counts().items():
d[v].append(k)
现在,您可以通过d[n]
轻松访问 n 次出现的项目。