我如何从Pyspark访问Couchbase

时间:2018-11-06 08:41:32

标签: scala apache-spark pyspark couchbase

我是使用 NoSQL 数据库的新手。我的集群上有 Spark 1.6.0 ,我需要从 Couchbase 存储桶中获取文档,并对其进行一些操作以将其加载回去。
我知道 ip 端口,存储桶的名称和存储桶的密码。不幸的是,我不知道如何使用 pyspark 访问该数据库。但是,如果不可能,我如何使用 scala 做到这一点?
此外,我需要使用 HBase 执行类似的操作。

非常感谢您的任何建议和有用的网址。

最好的问候,
弗拉基米尔。

1 个答案:

答案 0 :(得分:3)

要从Python工具世界访问Couchbase,您需要使用Python SDK。

从这里开始:https://docs.couchbase.com/python-sdk/2.5/start-using-sdk.html