Kotlin-基于大小和时间的块序列

时间:2018-06-25 11:35:16

标签: kotlin collections kotlin-coroutines

我有一个永无止境的流作为序列。 我的目标是根据时间和大小从序列中提取一批。

我的意思是,如果我的序列现在有2250条消息,我想发送3批(1000、1000、250)。

如果直到接下来的5分钟,我仍然没有积累1000条消息,无论如何我都会将其与到目前为止已积累的所有内容一起发送。

        sequence
        .chunked(1000)
        .map { chunk ->
            // do something with chunk
        }

我希望有一个类似.chunked(1000,300)的东西,当我想每5分钟发送一次时,秒数就是300。

预先感谢

1 个答案:

答案 0 :(得分:3)

科特琳Sequence是一个同步概念,不应以任何时间限制的方式使用。如果您要求下一个元素的顺序,则它将阻塞调用程序线程,直到产生下一个元素,并且无法取消它。

但是,kotlinx.coroutines库引入了Channel的概念,它是异步世界序列的粗略模拟,其中操作可能需要一些时间才能完成,并且在执行操作时不会阻塞线程所以。您可以在this guide中阅读更多内容。

它不提供现成的chunked运算符,但是使编写一个运算符变得简单。您可以使用以下代码:

import kotlinx.coroutines.experimental.channels.*
import kotlinx.coroutines.experimental.selects.*

fun <T> ReceiveChannel<T>.chunked(size: Int, time: Long) =
    produce<List<T>>(onCompletion = consumes()) {
        while (true) { // this loop goes over each chunk
            val chunk = mutableListOf<T>() // current chunk
            val ticker = ticker(time) // time-limit for this chunk
            try {
                whileSelect {
                    ticker.onReceive {
                        false  // done with chunk when timer ticks, takes priority over received elements
                    }
                    this@chunked.onReceive {
                        chunk += it
                        chunk.size < size // continue whileSelect if chunk is not full
                    }
                }
            } catch (e: ClosedReceiveChannelException) {
                return@produce // that is normal exception when the source channel is over -- just stop
            } finally {
                ticker.cancel() // release ticker (we don't need it anymore as we wait for the first tick only)
                if (chunk.isNotEmpty()) send(chunk) // send non-empty chunk on exit from whileSelect
            }
        }
    }

从这段代码中您可以看到,它嵌入了一些关于在极端情况下该做什么的重要决定。如果计时器到期但当前块仍为空,该怎么办?此代码开始新的时间间隔,并且不发送先前的(空)块。我们是在最后一个元素之后的超时中完成当前块,还是从第一个元素开始测量时间,还是从块的开头开始测量时间?这段代码稍后做。

这段代码完全是顺序的 -它的逻辑很容易逐步进行(代码内部没有并发性)。可以根据项目的具体要求进行调整。