如何在GCS中驻留的JSON文件中预览数据?

时间:2019-04-10 21:58:49

标签: cdap google-cloud-data-fusion

我第一次玩 Google数据融合(大约4个小时前就发布了Beta版),而我要做的第一件事就是相当愚蠢-阅读驻留在GCS存储桶中的JSON文件的内容。 GCS来源似乎是一件显而易见的事情。我已经这样配置了:

enter image description here

如果我单击“预览”选项卡,则会看到一条消息

  

“ Google云存储”阶段的预览数据不可用。

是因为我做错了什么,还是因为GCS源不支持预览数据?如果后者在这样的工具中非常有用,我会感到有些失望。

2 个答案:

答案 0 :(得分:2)

您提出所有合理的论点,我们将解决这些问题并改善经验。完全理解你在说什么。

尼丁

答案 1 :(得分:1)

好的,我发现了问题,Data Fusion实例正在运行的服务帐户需要访问存储分区。当我授予该访问权限时(通过将服务帐户添加到旧版存储管理员和Storage Object Viewer角色中),错误消息消失了(被另一条错误消息替代,但这是另一个线程的错误消息。)

这里有很多问题:

  • 我只是在尝试运行管道并在日志(“ <service account> does not have storage.buckets.get access to <bucket>”中看到有用的错误消息时才发现问题。在“预览”选项卡中没有错误消息可以表明问题所在,相同的错误消息应该在那里显示。
  • 为什么我不能选择我希望实例使用哪个服务帐户,而不是代表我创建一个服务帐户?