我需要向数据集中写入一些数据,并且需要有1列作为根,在该列中还有3列。如何在Python中做到这一点?我有Scala的工作代码。
var myDf = myDf.withColumn(rootColumn, struct(myDf("column1"), myDf("column2"), myDf("column3")))
我尝试使用pd.MultiIndex.from_product,将rootColumn放在顶部,但是在这种情况下不起作用。我需要上面的Spark代码中的确切结果。 架构有三列,一列是根,在该根列内我有多列。我需要进行更改,以便可以根据该架构将数据帧写入数据集。