Spark数据帧:是否会引发火花sql或火花流?

时间:2017-06-29 06:02:27

标签: apache-spark dataframe apache-spark-sql spark-streaming

spark数据帧的概念是否属于Spark SQL或Spark Streaming。传统上,数据帧似乎属于Spark SQL。但, 纠正我,如果错了,数据帧似乎也能够处理实时数据,所以我接受了这个问题。

1 个答案:

答案 0 :(得分:0)

Spark数据帧适用于 spark批处理 spark spark processing Spark数据帧本质上是分布式不可变,因此您无法对其进行更改,但会从现有的数据框架中创建一个新的 秒。您可以在Spark SQL, DataFrames and Datasets Guide

中获得更多信息

而且, spark sql 是我们在传统数据库中编写查询的概念,如 mysql spark streaming 是一个概念,其中 spark api 被定义为处理流数据。所以我的观点是他们是不同的概念。您可以区分 spark 中的批处理流处理