我在试图解决这个我一直在研究的问题时遇到了一些麻烦。我有一个从 SQLite 数据库中提取的股票数据列表。这是一个字典列表,字典看起来像这样:
[ {symbol:'AAPL', date:'2021-04-28', close:130},
{symbol:'AAPL', date:'2021-04-27', close:129},
{symbol:'MSFT', date:'2021-04-28', close:155},
{symbol:'MSFT', date:'2021-04-27', close:156} ]
我正在处理开盘价、最高价、最低价和收盘价数据,我想编写一个脚本来为每个数据点/时间戳分配指标值。为了分配这些指标,我需要将这些数据处理成一个新的列表,如下所示:
Stock data = [ {'AAPL':[ {date:'2021-04-28', close:130},
{date:'2021-04-27', close:129} ] },
{'MSFT':[ {date:'2021-04-28', close:155},
{date:'2021-04-27', close:156} ] } ]
我想创建一个字典列表,键是股票代码,值是包含在数据库中的所有 OHLC 数据(作为字典)的列表。
在我看来,这是一个包含字典列表的字典列表。
我不担心效率,因为我只想每天在半夜运行一次。
答案 0 :(得分:1)
这可以通过 itertools.groupby
完成,并进行一些后续操作以删除组键。
from itertools import groupby
lst = [{'symbol': 'AAPL', 'date': '2021-04-28', 'close': 130},
{'symbol': 'AAPL', 'date': '2021-04-27', 'close': 129},
{'symbol': 'MSFT', 'date': '2021-04-28', 'close': 155},
{'symbol': 'MSFT', 'date': '2021-04-27', 'close': 156}]
group_key = 'symbol'
print([{k: [{sub_k: sub_v for sub_k, sub_v in d.items() if sub_k != group_key}
for d in v]}
for k, v in groupby(lst, key=lambda x: x[group_key])])
输出:
[{'AAPL': [{'date': '2021-04-28', 'close': 130},
{'date': '2021-04-27', 'close': 129}]},
{'MSFT': [{'date': '2021-04-28', 'close': 155},
{'date': '2021-04-27', 'close': 156}]}]
编辑:假设列表尚未按 'symbol'
排序,则需要排序阶段:
from itertools import groupby
lst = [{'symbol': 'AAPL', 'date': '2021-04-28', 'close': 130},
{'symbol': 'MSFT', 'date': '2021-04-28', 'close': 155},
{'symbol': 'AAPL', 'date': '2021-04-27', 'close': 129},
{'symbol': 'MSFT', 'date': '2021-04-27', 'close': 156}]
group_key = 'symbol'
def get_key(x):
return x[group_key]
print([{k: [{sub_k: sub_v for sub_k, sub_v in d.items() if sub_k != group_key}
for d in v]}
for k, v in groupby(sorted(lst, key=get_key), key=get_key)])
输出:
[{'AAPL': [{'date': '2021-04-28', 'close': 130},
{'date': '2021-04-27', 'close': 129}]},
{'MSFT': [{'date': '2021-04-28', 'close': 155},
{'date': '2021-04-27', 'close': 156}]}]