标签: apache-spark spark-streaming
火花流中批量的输入大小表示什么? 它是否表示批次中的行数或其他内容? 我读了卡夫卡的小溪。
答案 0 :(得分:0)
输入大小表示从Kafka收到的数据集/ JSON的数量,以便在特定时间段内进行处理。
它还取决于您正在处理的数据类型。如图所示:
,
它是在上述时间段内从Kafka队列接收/读取的数据集数量。
这里的微批次计划为15秒。