我曾问过类似的问题,但我想问一个问题,是否可以使用 Microsoft Azure 来实现我的目标。
Is streaming input from external database (postgresql) supported in Apache Spark?
我在Microsoft Azure Postgresql上部署了一个数据库。我有一个table
,我想从中流访问。使用 Kafka connect ,似乎可以流式访问表,但是,在联机document上查找时,我找不到数据库(postgresql)作为数据源。
azure databricks
是否支持流读取Postgresql表?还是更好用
azure HDInsight 和 kafka 和 spark 吗?
我很高兴能得到一些帮助。
最好的问候,
渡边悠
答案 0 :(得分:1)
不幸的是,Azure Databricks不支持流读取Azure postgresql数据库。
带有Kafka和Spark的Azure HDInsight将是满足您需求的正确选择。
托管的Kafka以及与其他可用于构建完整数据平台的HDInsight产品的集成。
Azure还提供了数据平台所需的一系列其他托管服务,例如SQL Server,Postgre,Redis和Azure IoT Event Hub。
根据我的研究,我发现了integrate Databricks and PostgreSQL using Panoply的第三方工具名称“ Panoply ”。
希望这会有所帮助。