我想根据https://spark.apache.org/docs/latest/sparkr.html#gapply
使用gapply
问题是我返回了2个数据帧的列表。
return(list(df1,df2))
在这种情况下如何声明输出模式?
答案 0 :(得分:0)
你不能使用返回任意列表的函数。 As per gapply
documentation(强调我的):
函数func将键作为参数 - 分组列和数据帧 - 本地R
data.frame
。 func的输出是本地R data.frame
。
您可以通过将每个data.frame
视为单个Row
类型等同于struct<col1:array<typeofcol1>, col2:array<typeofcol2>, ..., coln:array<typeofcoln>>
,但只有,只要两个输出都可以使其成功data.frames
具有相同的架构。