有什么办法可以在Python数据框中创建根级别的列对象,例如Scala中的struct type?

时间:2019-04-17 14:55:15

标签: python scala dataframe

我需要向数据集中写入一些数据,并且需要有1列作为根,在该列中还有3列。如何在Python中做到这一点?我有Scala的工作代码。

var myDf  = myDf.withColumn(rootColumn, struct(myDf("column1"), myDf("column2"), myDf("column3")))

我尝试使用pd.MultiIndex.from_product,将rootColumn放在顶部,但是在这种情况下不起作用。我需要上面的Spark代码中的确切结果。 架构有三列,一列是根,在该根列内我有多列。我需要进行更改,以便可以根据该架构将数据帧写入数据集。

0 个答案:

没有答案