从HDFS CSV文件

时间:2018-01-21 08:19:25

标签: spark-dataframe

我通过从HDFS读取csv文件创建了Spark Dataframe。

我现在在READ上有一个模式,因为csv在不同的实例中可以有不同的列名,并且列数会因csv文件的不同而不同。

如何只提取"列名称"从架构StructType作为字符串到单独的数组或HashMap。

此致 Sanjeeb

1 个答案:

答案 0 :(得分:0)

如果您有数据框,则可以调用API columns(),它将以String数组的形式返回列的名称。

DataFrame (Spark 1.6.3 JavaDoc) - Apache Spark