标签: streaming spark-streaming
在实现流k均值的同时,需要对流数据进行特征选择的简单实现。 我正在目录中创建CSV文件流,并创建了流式k均值模型。我想将模型应用于此数据。 在应用模型之前,我想在流式CSV数据上创建特征向量。 没有足够的文档。 有人可以帮我吗?