我在这里非常初学。对不起如果我问过重复/愚蠢的问题。
指出,正如我的产品(Java Web应用程序)所要求的那样,我需要编写一些应该将数据推送到任何数据存储的应用程序(基于某些配置)。数据存储可以是RDBMS,Hive或任何NoSQL数据存储。所以查询是,SparkSql最适合我的情况,如果是的话,我可以拥有Spark SQL支持的数据存储列表。如果Spark不会这样做,他们是否有其他方法。
请帮助我!
答案 0 :(得分:0)
是的! SparkSql(Spark)最适合您的用例。 据我所知,SparkSql支持RDBMS,Hive和任何NoSQL数据存储。
SparkSQL可能没有直接访问少数商店的API,但在Spark的API的帮助下,您应该可以连接任何数据存储。
我们一直使用Spark连接到RDBMS,Cassandra,HBase,ElasticSearch,Solr,Hive,S3,HDFS等。