我有数据存储在磁盘上,数百万条记录的文件,每天一个。我有一个相对有效的反序列化器,可以产生发出记录的Observable,现在足够快(1.5M记录/秒)。
我想要的是现在连接这些Observable,以便我可以得到一个多天的跨度不间断的流。当这个简单的工作时,我感到很激动:
val nilObs: Observable[Record] = Observable.empty
val allObs = dates.map(reader.recordsForDate(_)).foldLeft(nilObs)(_ ++ _)
然而,上面的结果是Observable吞吐量很大 - 有200个连续的Observable,我看到的是50-100k / s,相比我预期的1.5M / s。
我还没有对它进行过分析,但是看https://github.com/Netflix/RxJava/blob/master/rxjava-core/src/main/java/rx/internal/operators/OperatorConcat.java它正在对队列进行大量的工作 - 我想知道我是否在一个队列中创建了N个队列,而不是N个Observable?
是否有更有效的方式以这种方式连接Observable?
答案 0 :(得分:5)
至少有一种更快的方法可以做到这一点:
val datesObs = Observable.from(dates.toIterable)
val allObs = datesObs.concatMap(reader.recordsForDate(_))
这有预期的表现,所以一切都很好。