处理需要根据未编入索引(?)变量进行分组并过滤的长序列表中的数据的最佳方法是什么?
我有一个dict列表看起来像这样(有更多的键,但这些是相关的)
[{'bol': True, 'location': 102, 'type': 39, 'value':293.3812}, ...]
列表很长(500k给或拿)我需要对它进行多次操作才能包含;按位置'过滤,按'类型分组'不知道所有类型是什么,通过' bol'进行子分组,按值排序'。我的最终目标是获得一个数据集(我想是.xml可能?),每个'类型都有2个值。最高价值' ' bol' =' bol'的真组和最小值。 =假组。关于"最佳"的任何建议处理这个的方法?
答案 0 :(得分:3)
这对我来说听起来像熊猫的工作!你知道吗?用python http://pandas.pydata.org/
进行数据分析真的很受欢迎我建议您查看此框架,因为您可以使用您的数据构建数据框,然后您要执行的操作是典型的数据框操作。
{{1}}