使用Python中的ReactiveX,如何汇总Observables流?
我有一串词典,{"用户":" ...","约会":...}。我想创建一个我可以应用的函数,用每个用户的最新日期累积字典,然后在流结束时发出累积的observable(它像max一样,但是必须查看用户字段,并将发出多个值。)
示例 - 输入流:
{ "user": "a", "date": "2017-02-14" }
{ "user": "b", "date": "2016-01-01" }
{ "user": "c", "date": "2015-01-01" }
{ "user": "a", "date": "2017-01-01" }
{ "user": "b", "date": "2017-01-01" }
预期输出(顺序无关紧要)
{ "user": "a", "date": "2017-02-14" }
{ "user": "c", "date": "2015-01-01" }
{ "user": "b", "date": "2017-01-01" }
我阅读"过滤Observables","转换Observables","组合Observables"和" Observable Operators的决策树"在https://ninmesara.github.io/RxPY/api/operators/index.html,并查看reduce / aggregate(仅在结束时发出单个值)和flat_map(不知道如何检测流的结尾)。 many_select和window(特别是)看起来很有希望,但我很难理解它们。
如何使用rx执行此操作(通过使用现有运算符之一,或通过创建自定义运算符[我不知道该怎么做]?)
答案 0 :(得分:0)
我认为以下可能会做你想要的。
import rx
rx.Observable.from_([
{ "user": "a", "date": "2017-02-14" },
{ "user": "b", "date": "2016-01-01" },
{ "user": "c", "date": "2015-01-01" },
{ "user": "a", "date": "2017-01-01" },
{ "user": "b", "date": "2017-01-01" }]) \
.group_by(lambda x: x['user']) \
.flat_map(lambda x: x.max_by(lambda y: y['date'], lambda a,b: -1 if a < b else 1 if a>b else 0)) \
.subscribe(print)
答案 1 :(得分:0)
汉斯&#39;答案很接近,只需要调整一下。
我的观察者希望获得{ 'user': ..., 'date': }
词典:
import rx
def pp1(x):
print type(x), x
rx.Observable.from_([
{ "user": "a", "date": "2017-02-14" },
{ "user": "b", "date": "2016-01-01" },
{ "user": "c", "date": "2015-01-01" },
{ "user": "a", "date": "2017-01-01" },
{ "user": "b", "date": "2017-01-01" }]) \
.map(lambda x: x[0]) \
.subscribe(pp1)
产量
<type 'dict'> {'date': '2017-02-14', 'user': 'a'}
<type 'dict'> {'date': '2016-01-01', 'user': 'b'}
<type 'dict'> {'date': '2015-01-01', 'user': 'c'}
<type 'dict'> {'date': '2017-01-01', 'user': 'a'}
<type 'dict'> {'date': '2017-01-01', 'user': 'b'}
执行.group_by和.flat_map会导致最后的观察者得到包含摘要的长度为1的列表,而不仅仅是摘要。
import rx
def pp1(x):
print type(x), x
rx.Observable.from_([
{ "user": "a", "date": "2017-02-14" },
{ "user": "b", "date": "2016-01-01" },
{ "user": "c", "date": "2015-01-01" },
{ "user": "a", "date": "2017-01-01" },
{ "user": "b", "date": "2017-01-01" }]) \
.group_by(lambda x: x['user']) \
.flat_map(lambda x: x.max_by(lambda y: y['date'], lambda a,b: -1 if a < b else 1 if a>b else 0)) \
.subscribe(pp1)
产量
<type 'list'> [{'date': '2017-02-14', 'user': 'a'}]
<type 'list'> [{'date': '2017-01-01', 'user': 'b'}]
<type 'list'> [{'date': '2015-01-01', 'user': 'c'}]
需要添加地图:
import rx
def pp1(x):
print type(x), x
rx.Observable.from_([
{ "user": "a", "date": "2017-02-14" },
{ "user": "b", "date": "2016-01-01" },
{ "user": "c", "date": "2015-01-01" },
{ "user": "a", "date": "2017-01-01" },
{ "user": "b", "date": "2017-01-01" }]) \
.group_by(lambda x: x['user']) \
.flat_map(lambda x: x.max_by(lambda y: y['date'], lambda a,b: -1 if a < b else 1 if a>b else 0)) \
.map(lambda x: x[0]) \
.subscribe(pp1)
产生预期的
<type 'dict'> {'date': '2017-02-14', 'user': 'a'}
<type 'dict'> {'date': '2017-01-01', 'user': 'b'}
<type 'dict'> {'date': '2015-01-01', 'user': 'c'}