分析mongodb中很少填充的字段

时间:2018-04-18 10:37:02

标签: python mongodb pandas

我有一个mongodb集合,有近100,000条记录,每条记录有大约5000个密钥。很多都是空的。我怎样才能找到(可能直观地表示)这种空虚的数据。 换句话说,我想分析每个键中值的类型。什么是正确的方法。

1 个答案:

答案 0 :(得分:0)

您可以查看MongoDB聚合策略。查看$group

从你如何暴露你的问题,我完全可以看到一个累加器超过每个记录的键数。 例如,通过适当的阈值和转换,这样的操作基本上可以返回按键数分组的记录(或者仅用每个记录的键数填充的数组)。

这种方法还可以让您对用于每条记录的密钥执行一些数据分析。