将scalaz-stream进程拆分为两个子流

时间:2014-12-17 09:35:49

标签: scala stream scalaz scalaz-stream

使用scalaz-stream是否可以拆分/分叉然后重新加入流?

作为一个例子,让我们说我有以下功能

val streamOfNumbers : Process[Task,Int] = Process.emitAll(1 to 10)

val sumOfEvenNumbers = streamOfNumbers.filter(isEven).fold(0)(add)
val sumOfOddNumbers  = streamOfNumbers.filter(isOdd).fold(0)(add)

zip( sumOfEven, sumOfOdd ).to( someEffectfulFunction )

使用scalaz-stream,在此示例中,结果将如您所期望的那样 - 从1到10的数字元组传递给接收器。

但是,如果我们用需要IO的东西替换streamOfNumbers,它实际上会执行两次IO动作。

使用Topic我能够创建一个正确复制流中元素的发布/订阅过程,但它不会缓冲 - 它只是尽可能快地消费整个源,而不管速度如何水槽消耗它。

我可以将它包装在一个有界的队列中,但是最终的结果会比它需要的要复杂得多。

是否有更简单的方法在scalaz-stream中拆分流而没有来自源的重复IO操作?

3 个答案:

答案 0 :(得分:6)

同样澄清之前的答案涉及“分裂”要求。您特定问题的解决方案可能无需拆分流:

val streamOfNumbers : Process[Task,Int] = Process.emitAll(1 to 10)
val oddOrEven: Process[Task,Int\/Int] = streamOfNumbers.map {
   case even if even % 2 == 0 => right(even)
   case odd => left(odd)
} 
val summed = oddOrEven.pipeW(sump1).pipeO(sump1)

val evenSink: Sink[Task,Int] = ???
val oddSink: Sink[Task,Int] = ???

summed
.drainW(evenSink)
.to(oddSink)

答案 1 :(得分:2)

您可能仍然可以使用主题,并确保在您推送主题之前订阅子进程。

但请注意,此解决方案没有任何限制,即如果您推得太快,则可能会遇到OOM错误。

def split[A](source:Process[Task,A]): Process[Task,(Process[Task,A], Proces[Task,A])]] = {
  val topic = async.topic[A]

  val sub1 = topic.subscribe
  val sub2 = topic.subscribe

  merge.mergeN(Process(emit(sub1->sub2),(source to topic.publish).drain))
}

答案 2 :(得分:0)

我同样需要这个功能。我的情况相当棘手,不允许我以这种方式解决它。

感谢Daniel Spiewak在this thread的回复,我得到了以下工作。我通过添加onHalt改进了他的解决方案,因此我的应用程序会在Process完成后退出。

def split[A](p: Process[Task, A], limit: Int = 10): Process[Task, (Process[Task, A], Process[Task, A])] = {
  val left = async.boundedQueue[A](limit)
  val right = async.boundedQueue[A](limit)

  val enqueue = p.observe(left.enqueue).observe(right.enqueue).drain.onHalt { cause =>
    Process.await(Task.gatherUnordered(Seq(left.close, right.close))){ _ => Halt(cause) }
  }
  val dequeue = Process((left.dequeue, right.dequeue))

  enqueue merge dequeue
}