标签: apache-spark header
我有一个用header =“ true”创建的spark数据集。现在,我只有这个数据集,而没有创建它的csv。我需要拉标题并对其进行处理。有人可以建议可以做什么。
我已经搜索了文档,但找不到任何方法,或者至少没有一种方法,而我找不到它。
ds.foreach(row -> predict(row, evaluator));
ds是数据集,而predict是一个函数。对于每一行,函数都会被调用。如果有可能在那儿获取标头,那也将有所帮助。甚至在此功能之外对我也有用。
ds