Thinbug
News
我们可以在基准记录上定义批次,而不是在火花流中定义时间(间隔)
时间:2016-03-01 06:24:08
标签:
apache-spark
streaming
batch-processing
有没有办法在火花流中定义批量定义,这样每个RDD代表一个记录而不是一个时间间隔的数据。
0 个答案:
没有答案
相关问题
基于行数而不是持续时间的滑动窗口
如果Spark计算时间大于批处理间隔,会发生什么
我可以在火花流中获取窗口中每个时间间隔的数据吗?
我们可以在基准记录上定义批次,而不是在火花流中定义时间(间隔)
我们如何在Apache Spark Streaming中处理/扩展可变大小的批次
我们可以在执行程序的批处理中使用缓存的RDD
获取批处理间隔的时间
我们可以在Cassandra中动态定义cols吗?
每个批次间隔的Spark流式传输最大记录
Spark Streaming为什么按固定间隔安排批次?
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?