第三方Scio客户端库为云数据流提供Scala API以访问Cloud Bigtable。因此,在此过程中,我无法在GCP中配置Scala API。请帮助。
链接:https://cloud.google.com/bigtable/docs/third-party-clients
答案 0 :(得分:1)
Scio只是一个包装Apache Beam Java SDK的Scala SDK。没有"配置" GCP中的Scio您只需使用Scio(Scala)或Scio和Apache Beam(Scala和Java)的某种组合编写Dataflow作业。
我通常使用Spotify提供的Giter8
模板使用Scio创建数据流作业。这需要sbt
工具。参考:https://github.com/spotify/scio-template.g8
>> sbt new spotify/scio-template.g8
系统会提示您输入项目名称和程序包命名空间。这会自动创建一个sbt
Scala项目。设置项目后,您可以像通常执行已编译的Scala二进制文件一样将管道部署到Dataflow。 Giter8
模板包含使用Scio编写的示例WordCount
数据流作业。
Scio参考:https://github.com/spotify/scio
参考:http://www.scala-sbt.org/0.13/docs/index.html