在Sparkr中使用gapply时声明输出模式

时间:2018-01-27 06:41:06

标签: dataframe schema sparkr gapply

我想根据https://spark.apache.org/docs/latest/sparkr.html#gapply

使用gapply

问题是我返回了2个数据帧的列表。

return(list(df1,df2))

在这种情况下如何声明输出模式?

1 个答案:

答案 0 :(得分:0)

你不能使用返回任意列表的函数。 As per gapply documentation(强调我的):

  

函数func将键作为参数 - 分组列和数据帧 - 本地R data.frame func的输出是本地R data.frame

您可以通过将每个data.frame视为单个Row类型等同于struct<col1:array<typeofcol1>, col2:array<typeofcol2>, ..., coln:array<typeofcoln>>但只有,只要两个输出都可以使其成功data.frames具有相同的架构。