应用错误收集

Spark Kafka结构化流式传输与Apache Ignite

时间：2017-08-08 11:30:23

标签： apache-spark apache-spark-sql spark-dataframe spark-streaming ignite

现在我无法在Apche Ignite中保存Spark DataFrames。它将包含在Apache Ignite 2.2版本中，如https://issues.apache.org/jira/browse/IGNITE-3084所述。我正在使用Apache Spark的结构化流API和Kafka来使用数据。我想做一些聚合，比如特定列的平均值或消耗数据的最小值。

我的问题是我是否应该使用Spark SQL DataFrame API来执行上述聚合，还是应该等待Apache Ignite 2.2版本？他们在文档中提到Ignite SQL比Spark SQL快100秒。

1 个答案:

答案 0 :(得分：1)

实际上，这取决于你。您现在可以继续使用Spark，然后等待Ignite中的DataFrames支持准备就绪，比较这两种方法并选择更适合您需求的方法。

Spark Structured Streaming
Spark结构化流媒体 -
使用Spark Structured Streaming编写时捕获Kafka偏移量
使用Spark结构化流2.2批量API进行Kafka偏移管理
结构化流与Kafka的依赖关系是什么？
Spark结构化流-时间戳常量
在Spark结构化流中获取错误
使用Kafka 2.4.0的MicroBatchExecution Spark结构化流媒体
了解Kakfa结构化流中的检查点
从Kafka主题反序列化Spark结构化流数据

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？