从Spark数据集中获取标题

时间:2019-04-10 01:34:16

标签: apache-spark header

我有一个用header =“ true”创建的spark数据集。现在,我只有这个数据集,而没有创建它的csv。我需要拉标题并对其进行处理。有人可以建议可以做什么。

我已经搜索了文档,但找不到任何方法,或者至少没有一种方法,而我找不到它。

ds.foreach(row -> predict(row, evaluator));

ds是数据集,而predict是一个函数。对于每一行,函数都会被调用。如果有可能在那儿获取标头,那也将有所帮助。甚至在此功能之外对我也有用。

0 个答案:

没有答案