我是谷歌云数据流的新手。我在我的Windows机器上设置了所有内容,当我尝试使用以下命令运行wordcount示例时:
mvn compile exec:java -Dexec.mainClass = com.nyt.dataflowPoc.WordCount -Dexec.args =" - project = cdfpoc-1264 --stagingLocation = gs:// poc-location / staging - -runner = BlockingDataflowPipelineRunner --output = gs:// poc-location"
它给了我以下错误。
引起:com.google.api.client.googleapis.json.GoogleJsonResponseException:400错误请求 { "代码" :400, "错误" :[{ "结构域" :"全球", "消息" :"无效值", "理由" :"无效" }], "消息" :"无效的价值" }
我查看了其他帖子,它说我需要提供projectID,其中shouuld是alpha numberic。我已经给出了但仍然是同样的错误。
有人可以帮忙吗?
提前致谢。
-Kapil
答案 0 :(得分:2)
问题来自:
--output=gs://poc-location
因此,您只指定一个桶。 WordCount实际上将此解释为输出的前缀,并尝试编写文件gs:// poc-location-00000-of-00001。由于此存储桶不存在,您将收到错误消息。 你的管道运行正常:
--output=gs://poc-location/
答案 1 :(得分:0)
问题得到解决。我给了分段和输出位置。当我深入研究代码时,我发现只需要其中一个代码。因此,当我删除--output参数时,我得到了实际输出,我可以在指定的存储位置看到结果。
谢谢, 卡皮尔