标签: spark-dataframe
我通过从HDFS读取csv文件创建了Spark Dataframe。
我现在在READ上有一个模式,因为csv在不同的实例中可以有不同的列名,并且列数会因csv文件的不同而不同。
如何只提取"列名称"从架构StructType作为字符串到单独的数组或HashMap。
此致 Sanjeeb
答案 0 :(得分:0)
如果您有数据框,则可以调用API columns(),它将以String数组的形式返回列的名称。
DataFrame (Spark 1.6.3 JavaDoc) - Apache Spark