我有一个永无止境的流作为序列。 我的目标是根据时间和大小从序列中提取一批。
我的意思是,如果我的序列现在有2250条消息,我想发送3批(1000、1000、250)。
如果直到接下来的5分钟,我仍然没有积累1000条消息,无论如何我都会将其与到目前为止已积累的所有内容一起发送。
sequence
.chunked(1000)
.map { chunk ->
// do something with chunk
}
我希望有一个类似.chunked(1000,300)的东西,当我想每5分钟发送一次时,秒数就是300。
预先感谢
答案 0 :(得分:3)
科特琳Sequence
是一个同步概念,不应以任何时间限制的方式使用。如果您要求下一个元素的顺序,则它将阻塞调用程序线程,直到产生下一个元素,并且无法取消它。
但是,kotlinx.coroutines
库引入了Channel
的概念,它是异步世界序列的粗略模拟,其中操作可能需要一些时间才能完成,并且在执行操作时不会阻塞线程所以。您可以在this guide中阅读更多内容。
它不提供现成的chunked
运算符,但是使编写一个运算符变得简单。您可以使用以下代码:
import kotlinx.coroutines.experimental.channels.*
import kotlinx.coroutines.experimental.selects.*
fun <T> ReceiveChannel<T>.chunked(size: Int, time: Long) =
produce<List<T>>(onCompletion = consumes()) {
while (true) { // this loop goes over each chunk
val chunk = mutableListOf<T>() // current chunk
val ticker = ticker(time) // time-limit for this chunk
try {
whileSelect {
ticker.onReceive {
false // done with chunk when timer ticks, takes priority over received elements
}
this@chunked.onReceive {
chunk += it
chunk.size < size // continue whileSelect if chunk is not full
}
}
} catch (e: ClosedReceiveChannelException) {
return@produce // that is normal exception when the source channel is over -- just stop
} finally {
ticker.cancel() // release ticker (we don't need it anymore as we wait for the first tick only)
if (chunk.isNotEmpty()) send(chunk) // send non-empty chunk on exit from whileSelect
}
}
}
从这段代码中您可以看到,它嵌入了一些关于在极端情况下该做什么的重要决定。如果计时器到期但当前块仍为空,该怎么办?此代码开始新的时间间隔,并且不发送先前的(空)块。我们是在最后一个元素之后的超时中完成当前块,还是从第一个元素开始测量时间,还是从块的开头开始测量时间?这段代码稍后做。
这段代码完全是顺序的 -它的逻辑很容易逐步进行(代码内部没有并发性)。可以根据项目的具体要求进行调整。