Spark SQL的“ MapGroupsWithState”中的数据集用法

时间:2019-04-02 18:59:49

标签: apache-spark apache-spark-sql spark-structured-streaming

我有"id and Map[String, List]"数据事件。我将这些数据按id分组。然后我用“ mapgroupswithstate”来计算一些东西。

我可以在from_json()中使用mapgroupswithstate方法吗?因此,我可以在dataset/dataframe中使用mapgroupswithstate吗?

例如;

df.groupBy().mapgroupswithstate{
   val anotherDF = events.toDF
   ... other operations...
}

1 个答案:

答案 0 :(得分:1)

我可以在mapgroupswithstate中使用from_json()方法吗?那么,我可以在mapgroupswithstate中使用数据集/数据框吗?

答案-对两个问题的回答均为“否”(宽松)。不以标准方式。 在mapgroupswithstate中进行操作时,您将进入执行程序级别的操作,您可以在不执行数据帧抽象的情况下编写自定义代码。