为什么该功能在本地有效但在Dataflow中不起作用?

时间:2019-09-10 15:18:40

标签: python apache google-cloud-platform dataflow beam

我正在尝试通过数据流向Google Analytics(分析)发布请求。第一步是从Big-query读取适当的参数-它工作正常。接下来是在HTTP发布请求中使用它们。在本地提供显式参数可以正常工作,但在数据流中,此步骤不执行任何操作。

这是我的代码(SendRequests类),其中el-BQ中的每个数据行。

class SendRequests(beam.DoFn):
    def __init__(self):
        super(SendRequests, self).__init__()
    def process(self, el):
        conn = httplib.HTTPConnection("www.google-analytics.com")
        params = urllib.urlencode(el)
        conn.request("POST", "/collect", params)
        yield 1

locally:
conn = http.client.HTTPConnection("www.google-analytics.com")
conn.request("POST", "/collect", params)

1 个答案:

答案 0 :(得分:0)

可能不是“无所事事” ...请检查日志文件。

此外,也许Dataflow作业仅使用私有IP地址运行。如果不是这种情况,除非Dataflow作业和该功能位于同一VPC中,否则该功能将无法访问。

我认为您不必启用Google私人访问,但请阅读此书,看看是否有帮助... https://cloud.google.com/vpc/docs/private-access-options

Gareth